Přeskočit na hlavní obsah
Překladatel
Tato stránka byla automaticky přeložena službou překladu strojů společnosti Microsoft. Dozvědět se více

Blog aplikace Microsoft Translator

Vlastní neuronový slovník překladatele Azure AI: Vyšší kvalita terminologického překladu 

Dnes s velkým potěšením oznamujeme vydání neuronového slovníku, který představuje významné zlepšení kvality překladu na naší platformě. V tomto blogovém příspěvku se budeme zabývat funkcí neuronového slovníku.

Úvod  

Neuronový slovník je rozšířením našeho dynamický slovník A slovník frází funkce v Azure AI Translator. Obě umožňují našim uživatelům přizpůsobit výstup překladu zadáním vlastních překladů pro konkrétní termíny nebo fráze. Naše předchozí metoda používala doslovný slovník, což byla přesná operace "najdi a nahraď". Neuronový slovník zlepšuje kvalitu překladu vět, které mohou obsahovat překlad jednoho nebo více termínů, tím, že umožňuje modelu strojového překladu upravit termín i kontext tak, aby vznikl plynulejší překlad. Zároveň zachovává vysokou přesnost překladu termínů.  

Následující anglicko-německý příklad ukazuje rozdíly ve výstupech překladu mezi oběma metodami, pokud je požadován překlad vlastní terminologie: 

Vstupní údaje:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Slovník Verbatim:   Grundkenntnisse der regelmäßigES Testen 
Neuronový slovník:   Grundkenntnisse des regelmäßigen Testens 

Zlepšení kvality 

Níže uvedený graf ilustruje výrazné zlepšení, které nová funkce přináší v běžných veřejně dostupných testovacích sadách terminologie v automobilovém průmyslu (https://aclanthology.org/2021.eacl-main.271), Zdraví (https://aclanthology.org/2021.emnlp-main.477) a domény Covid-19 (https://aclanthology.org/2021.wmt-1.69) pomocí našich obecných překladových modelů. 

Provedli jsme také řadu zákaznických hodnocení platformy Custom Translator a modelů neuronových slovníků. Měřili jsme nárůst kvality překladu na zákaznických datech mezi modely s rozšířením neuronového slovníku a bez něj. Zúčastnilo se pět zákazníků, kteří se zabývali němčinou, španělštinou a francouzštinou v různých obchodních oblastech.

Níže uvedený graf ukazuje průměrné zlepšení COMET v oblasti vzdělávání pro angličtinu-němčinu, angličtinu-španělštinu a angličtinu-francouzštinu; vlevo pro obecné modely a vpravo pro přizpůsobené modely. MODRÉ barevné sloupce představují obecnou kvalitu překladu bez neuronového slovníku a ORANŽOVÉ barevné sloupce představují kvalitu překladu s použitím neuronového slovníku. Jedná se o celkové průměrné zlepšení na celých testovacích sadách. U segmentů obsahujících jedno nebo více hesel zákaznického slovníku (mezi 19 % a 63 %) dosahuje zlepšení až +6,3 až +12,9 bodů COMET. 

 Podporované jazyky  

  • Aktuálně k dispozici (k 6. prosinci 2023): Z angličtiny a do angličtiny: zjednodušená čínština, francouzština, němčina, italština, japonština, korejština, polština, ruština, španělština a švédština.  
  • V budoucnu přidáme další. Aktualizace naleznete na adrese Poznámky k vydání Vlastního překladače 

Jak funguje neuronový slovník 

Neuronový slovník nepoužívá při zpracování vlastního překladu terminologie přesnou operaci "najdi a nahraď". Místo toho překládá termíny nebo fráze ze slovníku způsobem, který nejlépe odpovídá celému kontextu. To znamená, že termín může být skloňován nebo mít jiné skloňování či že okolní slova mohou být upravena, čímž vznikne plynulejší a souvislejší překlad.  

Řekněme, že máme například následující vstupní větu v angličtině a její překlad do polštiny bez slovníkových frází je následující:  

Vstupní údaje:   Potřebujeme rychlé řešení, které bude srozumitelné.  
Standardní překlad:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Chcete-li se ujistit, že je slovo "solution" přeloženo jako "alternativa" ("alternativa" v angličtině), můžete přidat dynamickou anotaci slovníku, abyste toho dosáhli:  

Vstupní údaje:   We need a fast <mstrans:dictionary translation=”alternativa“>solution</mstrans:dictionary> that will be understandable.  
Slovník Verbatim:   Potřebujeme rychlýego alternativa, który bude zrozumiały.  
Neuronový slovník:   Potřebujeme rychlýej alternativana, którA bude zrozumiałA.  

Výstup vytvořený předchozí metodou není plynulý, protože je porušena gramatická rodová konzistence. Neuronový slovník produkuje plynulý výstup tím, že a) skloňuje požadovanou náhradu a b) mění okolní slova, kde je to nutné. V některých případech může také změnit pád, jako v následujícím příkladu:  

Vstupní údaje:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Slovník Verbatim:   akcje tato firma žert tani.  
Neuronový slovník:   Akcje tato firma tane.   

Neuronový slovník očekává, že požadovaný překlad termínu bude poskytnut v jeho základním gramatickém tvaru. Podporovány jsou i víceslovné termíny, které by měly být poskytovány jako podstatná jména, tj. slova by neměla být lemmatizována samostatně (například "estonské parlamentní volby" bude lepší než "estonské parlamentní volby"). 

Jak povolit neuronový slovník 

Pro všechny podporované jazyky uvedené výše je neurální slovník okamžitě k dispozici všem zákazníkům, kteří používají platformu Custom Translator s slovníky frází. Pro zapnutí neuronového slovníku je nutné úplné (nebo pouze slovníkové) přeškolení vlastního modelu. 

 Doporučení 

  1. Pokud chcete zajistit, aby se heslo frázového slovníku při práci s neurálním slovníkem používalo častěji, můžete zvážit přidání hesla se zdrojovou částí v různých podobách. Ve výše uvedeném příkladu vedle "řešení _ alternativa", můžete také přidat následující položky: "Řešení _ alternativa", "řešení _ alternativy", "Řešení _ alternativy".  
  2. Pokud je cílem zajistit, aby se konkrétní slovo nebo fráze při použití frázového slovníku zkopírovaly ze vstupního textu do výstupního překladu "tak, jak jsou", zvažte prosazení doslovného slovníku, protože může být konzistentnější.   
  3. Vyvarujte se přidávání překladů běžných nebo častých slov či frází do slovníku frází.  

Chcete-li se dozvědět více o vlastním překladači a o tom, jak může pomoci vaší firmě prosperovat na globálním trhu, začněte s. Příručka pro začátečníky k vlastnímu překladači. 

Co můžete dělat s vlastním překladačem Microsoft 

Vytvářejte vlastní modely s terminologií specifickou pro vaši doménu a překládejte je v reálném čase pomocí Microsoft Translator API. 

Použít Vlastní překladatel společnosti Microsoft s vašimi překladatelskými řešeními, která vám pomohou globalizovat vaše podnikání a zlepšit interakci se zákazníky. 

Další informace naleznete na adrese Podniková řešení Microsoft Translator A Poznámky k vydání Vlastního překladače.