Gå til hovedindholdet
Oversætter
Denne side er automatisk oversat af Microsoft Translator maskinoversættelsestjeneste. Lær mere

Microsoft Translator blog

Azure AI Custom Translator Neural ordbog: Højere kvalitet i terminologioversættelse 

I dag er vi superglade for at kunne annoncere udgivelsen af neural ordbog, som er en væsentlig forbedring af oversættelseskvaliteten på vores platform. I dette blogindlæg vil vi udforske den neurale ordbogsfunktion.

Introduktion  

Neural ordbog er en udvidelse af vores dynamisk ordbog Og Ordbog over sætninger funktioner i Azure AI Translator. Begge giver vores brugere mulighed for at tilpasse oversættelsesoutputtet ved at levere deres egne oversættelser for specifikke termer eller sætninger. Vores tidligere metode brugte verbatim dictionary, som var en nøjagtig find-og-erstat-operation. Neural dictionary forbedrer oversættelseskvaliteten for sætninger, der kan indeholde en eller flere termoversættelser, ved at lade maskinoversættelsesmodellen justere både termen og konteksten for at producere en mere flydende oversættelse. Samtidig bevarer den den høje oversættelsesnøjagtighed for termer.  

Det følgende engelsk-tyske eksempel viser forskelle i oversættelsesoutput mellem de to metoder, når der anmodes om en brugerdefineret terminologioversættelse: 

Input:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Ordret ordbog:   Grundkenntnisse der regelmäßigEs Testen 
Neural ordbog:   Grundkenntnisse des regelmäßigen Testens 

Kvalitetsforbedring 

Diagrammet nedenfor illustrerer de betydelige forbedringer, den nye funktion giver i forhold til almindelige offentligt tilgængelige terminologitestsæt i bilindustrien (https://aclanthology.org/2021.eacl-main.271), Sundhed (https://aclanthology.org/2021.emnlp-main.477) og Covid-19-domæner (https://aclanthology.org/2021.wmt-1.69) ved hjælp af vores generelle oversættelsesmodeller. 

Vi gennemførte også en række kundeevalueringer af Custom Translator-platformen og de neurale ordbogsmodeller. Vi målte gevinsten i oversættelseskvalitet på kundedata mellem modeller med og uden udvidelsen med neurale ordbøger. Fem kunder deltog, som dækkede tysk, spansk og fransk inden for forskellige forretningsområder.

Diagrammet nedenfor viser den gennemsnitlige forbedring af KOMET i uddannelsesdomænet for engelsk-tysk, engelsk-spansk og engelsk-fransk; for generelle modeller til venstre og for tilpassede modeller til højre. BLÅ farvebjælker repræsenterer generel oversættelseskvalitet uden neural ordbog, og ORANGE farvebjælker repræsenterer oversættelseskvalitet med neural ordbog. Dette er overordnede gennemsnitlige forbedringer på hele testsættene. For segmenter, der indeholder en eller flere af kundens ordbogsopslag (mellem 19 % og 63 %), er forbedringen så høj som +6,3 til +12,9 COMET-point. 

 Understøttede sprog  

  • Tilgængelig i øjeblikket (pr. 6. december 2023): Forenklet kinesisk, fransk, tysk, italiensk, japansk, koreansk, polsk, russisk, spansk og svensk - til og fra engelsk.  
  • Vi tilføjer flere i fremtiden. For opdateringer, se Udgivelsesbemærkninger til Custom Translator 

Sådan fungerer en neural ordbog 

Neurale ordbøger anvender ikke den nøjagtige find-og-erstat-operation, når de håndterer oversættelse af brugerdefineret terminologi. I stedet oversætter den termer eller sætninger fra ordbogen på en måde, der passer bedst til hele konteksten. Det betyder, at termen kan bøjes eller have en anden kasus, eller at de omgivende ord kan justeres, hvilket giver en mere flydende og sammenhængende oversættelse.  

Lad os for eksempel sige, at vi har følgende input-sætning på engelsk, og oversættelsen til polsk uden nogen ordbogsfraser er som følger:  

Input:   Vi har brug for en hurtig løsning, der er til at forstå.  
Standardoversættelse:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Hvis du vil være sikker på, at "solution" bliver oversat til "alternatywa" ("et alternativ" på engelsk), kan du tilføje en dynamisk ordbogsannotation for at opnå det:  

Input:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Ordret ordbog:   Potrzebujemy szybkiego alternatywa, który będzie zrozumiały.  
Neural ordbog:   Potrzebujemy szybkiej Alternativwy, którA będzie zrozumiałA.  

Det output, der produceres med den tidligere metode, er ikke flydende, da den grammatiske kønskonsistens brydes. Den neurale ordbog producerer flydende output ved a) at bøje den ønskede erstatning og b) ændre de omgivende ord, hvor det er nødvendigt. Den kan også ændre kasus i nogle tilfælde, som i det følgende eksempel:  

Input:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Ordret ordbog:   akcje tej firmy spøg tani.  
Neural ordbog:   Akcje tej firmy tanie.   

Den neurale ordbog forventer, at den ønskede oversættelse af en term leveres i dens grundlæggende grammatiske form. Termer med flere ord understøttes også og skal leveres som substantivfraser, dvs. at ordene ikke skal lemmatiseres uafhængigt af hinanden (for eksempel vil "estisk parlamentsvalg" være bedre end "estisk parlamentsvalg"). 

Sådan aktiveres neural ordbog 

For alle understøttede sprog, der er anført ovenfor, er neurale ordbøger straks tilgængelige for alle kunder, der bruger Custom Translator-platformen med sætningsordbøger. Fuld (eller kun ordbog) brugerdefineret modelgenoptræning er påkrævet for at aktivere neural ordbog. 

 Anbefalinger 

  1. Hvis du vil sikre, at sætningsordbogsopslaget bliver brugt oftere, når du arbejder med neuralordbogen, kan du overveje at tilføje sætningsopslaget med kildedelen i forskellige former. I eksemplet ovenfor er der ud for "solution _" tilføjet alternatywa", kan du også tilføje følgende poster: "Løsning _ alternatywa", "løsninger _ alternativwy", "Løsninger _ alternativwy".  
  2. Hvis målet er at sikre, at et bestemt ord eller en bestemt sætning kopieres "som det er" fra inputteksten til outputoversættelsen, når man bruger sætningsordbogen, skal man overveje at håndhæve ordret ordbog, da det kan være mere konsekvent.   
  3. Undgå at tilføje oversættelser af almindelige eller hyppige ord eller sætninger til sætningsordbogen.  

Hvis du vil vide mere om Custom Translator, og hvordan det kan hjælpe din virksomhed med at trives på det globale marked, kan du starte med at læse Begyndervejledning til Custom Translator. 

Hvad du kan gøre med Microsoft Custom Translator 

Byg brugerdefinerede modeller med din domænespecifikke terminologi, og oversæt i realtid ved hjælp af Microsoft Translator-API. 

Bruge Microsoft brugerdefineret oversætter med dine oversættelsesløsninger for at hjælpe med at globalisere din virksomhed og forbedre kundeinteraktionerne. 

For mere information, besøg Microsoft Translator forretningsløsninger Og Udgivelsesbemærkninger til Custom Translator.