Jump to the main content
Prevodilac
Ovu stranicu automatski prevodi prevođenje mašine za prevodioca Microsoft prevoditelja. Naučiti više

Microsoft blog za prevodjenje

Azure AI Custom Translator Neural Dictionary: Delivering Higher Terminology Translation Quality 

Danas smo veoma uzbuđeni što možemo da objavimo objavljivanje neuralnog rečnika, značajnog poboljšanja kvaliteta prevoda na našu platformu. U ovom blogu ćemo istražiti funkciju neuralnog rečnika.

Uvođenje  

Neuralni rečnik je proširenje našeg rečnika. dinamicki rjecnik I rjecnik fraza Azure AI prevodilac Oba omogućavaju našim korisnicima da prilagode izlaz prevođenja pružajući sopstvene prevode za određene termine ili fraze. Naš prethodni metod je koristio doslovno rečnik, koji je bio tačna operacija pronalaženja i zamene. Neuralni rečnik poboljšava kvalitet prevođenja rečenica koje mogu uključivati jedan ili više prevoda termina tako što omogućava modelu mašinskog prevođenja da prilagodi i termin i kontekst kako bi proizveo tečniji prevod. Istovremeno čuva visoku preciznost prevođenja.  

Sljedeći englesko-njemački primjer pokazuje razlike u izlazima prevođenja između obje metode kada se traži prilagođeni prevod terminologije: 

Unosa:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Verbatim rječnik:   Grundkenntnisse Der regelmäßigEs Testen 
Neuralni rječnik:   Grundkenntnisse Des regelmäßigen Testens 

Poboljšanje kvalitete 

Grafikon u nastavku ilustruje značajna poboljšanja koja nova funkcija donosi na uobičajene javno dostupne terminološke testove u automobilskoj industriji (https://aclanthology.org/2021.eacl-main.271), Zdravlje (https://aclanthology.org/2021.emnlp-main.477) i COVID-19 domeni (https://aclanthology.org/2021.wmt-1.69) koristeći naše opšte modele prevođenja. 

Takođe smo sproveli niz procena klijenata na platformi Custom Translator i modelima neuronskih rečnika. Izmerili smo napredak u kvalitetu prevoda na korisničkim podacima između modela sa i bez proširenja neuralnog rečnika. Učestvovalo je pet kupaca, pokrivajući nemački, španski i francuski jezik u različitim poslovnim domenima.

Grafikon ispod prikazuje prosečno poboljšanje KOMETA u domenu obrazovanja za engleski-nemački, englesko-španski i englesko-francuski; za opšte modele sa leve strane i za prilagođene modele sa desne strane. Plave trake u boji predstavljaju opšti kvalitet prevođenja bez neuronskog rečnika, a ORANGE trake u boji predstavljaju kvalitet prevoda pomoću neuronskog rečnika. Ovo su prosječna poboljšanja na svim testnim setovima. Za segmente koji uključuju jedan ili više unosa u rečnik kupaca (između 19% i 63%), poboljšanje je čak +6,3 do +12,9 COMET poena. 

 Podržani jezici  

  • Trenutno dostupno (od 6. decembra 2023): kineski pojednostavljeni, francuski, njemački, italijanski, japanski, korejski, poljski, ruski, španski i švedski – na i sa engleskog.  
  • U narednom periodu ćemo dodavati još. Za ažuriranje, pogledajte Napomene o izdanju Custom Translator 

Kako funkcioniše neuralni rečnik 

Neuralni rečnik ne koristi tačnu operaciju pronalaženja i zamene prilikom rukovanja prilagođenim prevodom terminologije. Umesto toga, prevodi termine ili fraze iz rečnika na način koji se najbolje uklapa u ceo kontekst. To znači da se termin može naneti ili imati različito kućište, ili da se okolne reči mogu prilagoditi, proizvodeći tečniji i koherentniji prevod.  

Recimo, na primjer, imamo sljedeću ulaznu rečenicu na engleskom jeziku i njen prijevod na poljski bez ikakvih rječnika fraza je sljedeći:  

Unosa:   Treba nam brzo rešenje koje će biti razumljivo.  
Standardni prijevod:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Ukoliko želite da se uverite da je "rešenje" prevedeno kao "alternatywa" ("alternativa" na engleskom jeziku), možete dodati dinamičku anotaciju rječnika da biste postigli da:  

Unosa:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Verbatim rječnik:   potrzebujemy szybkiEgo alternatywa, który będzie zrozumiały.  
Neuralni rječnik:   potrzebujemy szybkiej alternativnowy, którA będzie zrozumiałA.  

Izlaz proizveden prethodnom metodom nije tečno jer je narušena gramatička rodna konzistentnost. Neuralni rječnik proizvodi tečni izlaz a) inflektiranjem tražene zamjene i b) promjenom okolnih riječi gdje je to potrebno. Također može promijeniti kućište u nekim slučajevima, kao u sljedećem primjeru:  

Unosa:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Verbatim rječnik:   akcje tej firmy jest tani.  
Neuralni rječnik:   akcje tej firmy tanie.   

Neuralni rečnik očekuje da je traženi prevod termina obezbeđen u njegovom osnovnom gramatičkom obliku. Termini sa više reči su takođe podržani i treba ih dati kao imenice, tj. reči ne bi trebalo da budu lemmatizovane nezavisno (na primer, "estonski parlamentarni izbori" će biti bolji od "izbori za parlament u Estoniji"). 

Kako omogućiti neuralni rečnik 

Za sve gore navedene podržane jezike, neuralni rečnik je odmah dostupan svim korisnicima koji koriste Custom Translator platformu sa rječnici fraze. Potrebna je potpuna (ili samo rječnik) prilagođena prekvalifikacija modela kako bi se omogućio neuralni rječnik. 

 Preporuke 

  1. Ako želite da se uverite da se unos rečnika fraze češće koristi prilikom rada sa neuronskim rečnikom, možete razmotriti dodavanje unosa fraze sa izvornim delom u različitim oblicima. U gornjem primjeru, pored "rješenja _ alternatywa", možda želite dodati i sljedeće unose: "Rješenje _ alternatywa", "rješenja _ alternatywy", "Rješenja _ alternatywy".  
  2. Ako je cilj da se osigura da se određena reč ili fraza kopira "kao što jeste" iz ulaznog teksta u izlazni prevod kada se koristi rečnik fraza, razmislite o sprovođenju verbatimskog rečnika jer može biti konzistentniji.   
  3. Izbegavajte dodavanje prevoda uobičajenih ili čestih reči ili fraza u rečnik fraza.  

Da biste saznali više o Custom Translatoru i kako on može pomoći vašem poslovanju da napreduje na globalnom tržištu, počnite s Vodič za početnike Custom Translator. 

Šta možete uraditi sa Microsoft korisničkih prevodioca 

Izgradite prilagođene modele sa terminologijom specifičnom za vašu domenu i prevodite u realnom vremenu koristeći API za prevodioca Microsofta. 

Koristiti Microsoft Custom Translator sa svojim prevodilačkim rješenjima koja će vam pomoći da globalizirate svoje poslovanje i poboljšate interakciju s klijentima. 

Za više informacija posjetite Poslovna rješenja Microsoft Translator I Napomene o izdanju Custom Translator.