Azure AI Custom Translator Neural Dictionary: Skilar hærri hugtökum Þýðingargæði
Í dag erum við mjög spennt að tilkynna útgáfu taugaorðabókar, veruleg endurbætur á þýðingargæðum á vettvang okkar. Í þessari bloggfærslu munum við kanna taugaorðabókareiginleikann.
Kynning
Tauga orðabók er í framhaldi af okkar dynamic orðabók og orðasamband orðabók eiginleikar í Azure AI Translator. Báðir leyfa notendum okkar að sérsníða þýðingar framleiðsla með því að veita eigin þýðingar þeirra fyrir ákveðin hugtök eða orðasambönd. Fyrri aðferð okkar notaði orðrétta orðabók, sem var nákvæm finna-og-skipta um aðgerð. Taugaorðabók bætir þýðingargæði fyrir setningar sem geta falið í sér eina eða fleiri tímaþýðingar með því að láta vélþýðingarlíkanið stilla bæði hugtakið og samhengið til að framleiða reiprennandi þýðingu. Á sama tíma varðveitir það hágæða þýðingarnákvæmni.
Eftirfarandi ensk-þýskt dæmi sýnir mun á þýðingarfrálagi milli beggja aðferða þegar óskað er eftir sérsniðinni íðorðaþýðingu:
Ílag: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Orðrétt orðabók: | Grundkenntnisse Der Regelmäßiges Prófis |
Tauga orðabók: | Grundkenntnisse Des Regelmäßigis PrófENS |
Gæðaumbætur
Myndin hér að neðan sýnir verulegar endurbætur sem nýi eiginleikinn hefur í för með sér á algengum opinberum hugtakaprófunarsettum í bílum (https://aclanthology.org/2021.eacl-main.271), Heilsa (https://aclanthology.org/2021.emnlp-main.477) og Covid-19 lén (https://aclanthology.org/2021.wmt-1.69) með því að nota almenn þýðingarlíkön okkar.
Við gerðum einnig röð af mati viðskiptavina á Custom Translator pallinum og taugaorðabókarlíkönum. Við mældum þýðingargæðahagnað á gögnum viðskiptavina milli líkana með og án taugaorðabókarviðbótarinnar. Fimm viðskiptavinir tóku þátt og náðu yfir þýsku, spænsku og frönsku á mismunandi viðskiptasviðum.
Taflan hér að neðan sýnir meðaltal framför HALASTJARNA á menntasviði ensku-þýsku, ensku-spænsku og ensku-frönsku; fyrir almennar gerðir til vinstri og fyrir sérsniðnar gerðir til hægri. BLUE litastikur tákna almennar þýðingar gæði án tauga orðabók og Orange litastikur tákna þýðingar gæði með tauga orðabók. Þetta eru heildarframfarir að meðaltali á öllum prófunarsöfnunum. Fyrir hluta sem innihalda eina eða fleiri orðabókarfærslur viðskiptavina (á milli 19% og 63%) er framförin allt að +6.3 til +12.9 COMET stig.
Tungumála
- Eins og er í boði (frá og með 6. desember 2023): Einfölduð kínverska, franska, þýska, ítalska, japanska, kóreska, pólska, rússneska, spænska og sænska - til og frá ensku.
- Við erum að bæta við fleiri í framtíðinni. Fyrir uppfærslur, sjá Útgáfuathugasemdir sérsniðinna þýðenda.
Hvernig taugaorðabók virkar
Tauga orðabók ekki ráða nákvæmlega finna-og-skipta aðgerð þegar meðhöndlun sérsniðin hugtök þýðingar. Þess í stað þýðir það hugtök eða orðasambönd úr orðabókinni á þann hátt sem hentar best öllu samhenginu. Þetta þýðir að hugtakið getur verið beygt eða haft mismunandi hlíf, eða að hægt er að breyta orðunum í kring og búa til reiprennandi og samfelldari þýðingu.
Segjum til dæmis að við höfum eftirfarandi inntakssetningu á ensku og þýðing hennar á pólsku án orðasambanda er sem hér segir:
Ílag: | Við þurfum skjóta lausn sem verður skiljanleg. |
Stöðluð þýðing: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Ef þú vilt ganga úr skugga um að "lausn" sé þýdd sem "Varamaður" ("val" á ensku), getur þú bætt við dynamic orðabók skýringartexta til að ná því:
Ílag: | We need a fast <mstrans:dictionary translation=”Varamaður“>solution</mstrans:dictionary> that will be understandable. |
Orðrétt orðabók: | Potrzebujemy szybkiegó Varamaður, który Będzie zrozumiały. |
Tauga orðabók: | Potrzebujemy szybkiEJ varamaðurWY, która Będzie zrozumiała. |
Útkoman sem fæst með fyrri aðferðinni er ekki reiprennandi þar sem málfræðilegt kynjasamræmi er brotið. Taugaorðabókin framleiðir reiprennandi framleiðsla með því að a) beygja umbeðna skiptingu og b) breyta nærliggjandi orðum þar sem þörf krefur. Það geta einnig breyting the hlíf í sumir tilfelli, eins og í the hópur stuðningsmanna fordæmi:
Ílag: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Orðrétt orðabók: | akcje Tej Firmy jest takkNi. |
Tauga orðabók: | Akcje Tej Firmy są takkNie. |
Taugaorðabók gerir ráð fyrir að umbeðin þýðing hugtaks sé veitt í grunnmálfræðilegu formi. Margorða hugtök eru einnig studd og ætti að gefa þau upp sem nafnorðasambönd, þ.e. orð ættu ekki að vera lemmuð sjálfstætt (til dæmis verða "eistneskar þingkosningar" betri en "þingkosningar í Eistlandi").
Hvernig á að virkja taugaorðabók
Fyrir öll studd tungumál sem talin eru upp hér að ofan er taugaorðabók strax í boði fyrir alla viðskiptavini sem nota Custom Translator vettvang með orðasambönd orðabækur. Full (eða orðabók aðeins) sérsniðin líkan endurmenntun er krafist til að gera tauga orðabók.
Tillögur
- Ef þú vilt tryggja að orðasambandsorðabókarfærslan sé notuð oftar þegar unnið er með taugaorðabók gæti komið til greina að bæta setningafærslunni við upprunahlutann í ýmsum myndum. Í dæminu hér að ofan, við hliðina á "lausn _ Varamaður", mega þú vilja til bæta við the hópur stuðningsmanna entries eins og heilbrigður: "Lausn _ Varamaður", "lausnir _ alternatywy", "Lausnir _ alternatywy".
- Ef markmiðið er að tryggja að tiltekið orð eða setning sé afritað "eins og það er" úr inntakstexta í framleiðsluþýðingu þegar setningaorðabók er notuð skaltu íhuga að framfylgja orðréttri orðabók þar sem það gæti verið stöðugra.
- Forðastu að bæta þýðingum á algengum eða algengum orðum eða orðasamböndum við orðabókina.
Til að læra meira um Custom Translator og hvernig það getur hjálpað fyrirtækinu þínu að dafna á alþjóðlegum markaðstorgi skaltu byrja á Sérsniðin leiðarvísir fyrir byrjendur þýðenda.
Hvað sem þú getur gert með Microsoft Sérsniðin Þýðandi
Búðu til sérsniðnar gerðir með lénssértækum hugtökum þínum og þýddu rauntíma með því að nota Microsoft Þýðandi API.
Nota Sérsniðin þýðingatól Microsoft með þýðingarlausnum þínum til að hjálpa hnattvæðingu fyrirtækis þíns og bæta samskipti viðskiptavina.
Nánari upplýsingar er að finna á Viðskiptalausnir Microsoft Translator og Útgáfuathugasemdir sérsniðinna þýðenda.