Azure AI Custom Translator Nevronski slovar: Zagotavljanje višje kakovosti terminološkega prevajanja
Danes z velikim veseljem napovedujemo sprostitev nevronskega slovarja, ki predstavlja pomembno izboljšavo kakovosti prevajanja na naši platformi. V tem prispevku bomo raziskali funkcijo nevronskega slovarja.
Uvod
Nevronski slovar je razširitev našega dinamični slovar In slovar fraz funkcije v Azure AI Translator. Obe omogočata našim uporabnikom, da prilagodijo rezultat prevoda z zagotavljanjem lastnih prevodov za določene izraze ali besedne zveze. Naša prejšnja metoda je uporabljala dobesedni slovar, ki je bil natančna operacija iskanja in zamenjave. Nevronski slovar izboljša kakovost prevoda za stavke, ki lahko vključujejo enega ali več prevodov izrazov, tako da model strojnega prevajanja prilagodi tako izraz kot kontekst in tako ustvari bolj tekoč prevod. Hkrati ohranja visoko natančnost prevoda izrazov.
Naslednji angleško-nemški primer prikazuje razlike v rezultatih prevajanja med obema metodama, ko je zahtevan prevod terminologije po meri:
Vnos: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Slovar Verbatim: | Grundkenntnisse der regelmäßigES Testsl |
Nevronski slovar: | Grundkenntnisse des regelmäßigsl Testens |
Izboljšanje kakovosti
Spodnja tabela prikazuje pomembne izboljšave, ki jih nova funkcija prinaša pri običajnih javno dostopnih terminoloških testnih nizih v avtomobilski industriji (https://aclanthology.org/2021.eacl-main.271), zdravje (https://aclanthology.org/2021.emnlp-main.477) in domen Covid-19 (https://aclanthology.org/2021.wmt-1.69) z uporabo naših splošnih prevajalskih modelov.
Izvedli smo tudi vrsto uporabniških vrednotenj platforme Custom Translator in modelov nevronskih slovarjev. Izmerili smo povečanje kakovosti prevodov na podatkih strank med modeli z razširitvijo nevronskega slovarja in brez nje. Sodelovalo je pet strank, ki so se ukvarjale z nemščino, španščino in francoščino na različnih poslovnih področjih.
Spodnji graf prikazuje povprečno izboljšanje COMET na področju izobraževanja za angleško-nemški, angleško-španski in angleško-francoski jezik; za splošne modele na levi in za prilagojene modele na desni. Modre barvne črte predstavljajo splošno kakovost prevoda brez nevronskega slovarja, oranžne pa kakovost prevoda z uporabo nevronskega slovarja. To so splošne povprečne izboljšave na celotnih testnih nizih. Pri segmentih, ki vključujejo enega ali več vnosov iz slovarja stranke (med 19 % in 63 %), je izboljšanje kar +6,3 do +12,9 točke COMET.
Podprti jeziki
- Trenutno je na voljo (od 6. decembra 2023): V angleščino in iz nje: poenostavljena kitajščina, francoščina, nemščina, italijanščina, japonščina, korejščina, poljščina, ruščina, španščina in švedščina.
- V prihodnosti jih bomo dodali še več. Posodobitve so na voljo na spletnem mestu Opomba k izdaji Prevajalnik po meri.
Kako deluje nevronski slovar
Nevronski slovar pri prevajanju terminologije po meri ne uporablja natančne operacije poišči in zamenjaj. Namesto tega prevaja termine ali besedne zveze iz slovarja na način, ki najbolj ustreza celotnemu kontekstu. To pomeni, da se termin lahko pregiblje ali ima drugačno sklanjatev ali da se prilagodijo okoliške besede, kar omogoča bolj tekoč in skladen prevod.
Recimo, da imamo na primer naslednji vhodni stavek v angleščini in njegov prevod v poljščino brez slovarskih fraz je naslednji:
Vnos: | Potrebujemo hitro in razumljivo rešitev. |
Standardni prevod: | Potrebujemo hitrejše rešitve, ki bodo razumljive. |
Če želite zagotoviti, da se "rešitev" prevede kot "alternativa" ("alternativa" v angleščini), lahko za to dodate dinamično opombo slovarja:
Vnos: | We need a fast <mstrans:dictionary translation=”alternativa“>solution</mstrans:dictionary> that will be understandable. |
Slovar Verbatim: | Potrebujemo hitre dokumenteego alternativa, który będzie zrozumiały. |
Nevronski slovar: | Potrebujemo hitre dokumenteej alternativaWy, którA będzie zrozumiałA. |
Rezultat, ki ga je ustvarila prejšnja metoda, ni tekoč, saj je slovnična skladnja med spoloma kršena. Nevronski slovar ustvari tekoč izpis tako, da a) preglasi zahtevano zamenjavo in b) po potrebi spremeni okoliške besede. V nekaterih primerih lahko spremeni tudi sklanjatev, kot v naslednjem primeru:
Vnos: | This company’s <mstrans:dictionary translation=”akcije“>stock</mstrans:dictionary> is cheap. |
Slovar Verbatim: | akcije ta podjetja je tani. |
Nevronski slovar: | Akcije ta podjetja so tanie. |
Nevronski slovar pričakuje, da je zahtevani prevod izraza podan v njegovi osnovni slovnični obliki. Podprti so tudi večbesedni termini, ki jih je treba zagotoviti kot samostalniške besedne zveze, kar pomeni, da se besede ne smejo lematizirati samostojno (na primer "estonske parlamentarne volitve" bo bolje kot "estonske parlamentarne volitve").
Kako omogočiti nevronski slovar
Za vse zgoraj navedene podprte jezike je nevronski slovar takoj na voljo vsem strankam, ki uporabljajo platformo Custom Translator z slovarji frazemov. Za omogočanje nevronskega slovarja je potrebno popolno prekvalificiranje modela po meri (ali samo slovar).
Priporočila
- Če želite zagotoviti, da se geselski slovar pogosteje uporablja pri delu z nevronskim slovarjem, lahko razmislite o dodajanju geselskega slovarja z izvornim delom v različnih oblikah. V zgornjem primeru je poleg "rešitev _ alternativa", boste morda želeli dodati tudi naslednje vnose: "Rešitev _ alternativa", "rešitve _ alternativa", "Rešitve _ alternativa".
- Če je cilj zagotoviti, da se določena beseda ali besedna zveza kopira "kot je" iz vhodnega besedila v izhodni prevod pri uporabi slovarja besednih zvez, razmislite o uporabi dobesednega slovarja, saj je lahko bolj dosleden.
- Izogibajte se dodajanju prevodov pogostih ali običajnih besed ali besednih zvez v slovar fraz.
Če želite izvedeti več o Custom Translator in kako lahko pomaga vašemu podjetju uspeti na globalnem trgu, začnite z Navodila za začetnike za prevajalce po meri.
Kaj lahko naredite z Microsoftovim prevajalnikom po meri
Ustvarite modele po meri s terminologijo, značilno za vašo domeno, in jih v realnem času prevedite z uporabo Microsoftov API za prevajanje.
Uporabo Microsoftov prevajalnik po meri s svojimi prevajalskimi rešitvami, da bi pomagali globalizirati svoje poslovanje in izboljšati interakcije s strankami.
Za več informacij obiščite Poslovne rešitve Microsoft Translator In Opomba k izdaji Prevajalnik po meri.