Zu Hauptinhalt springen
Translator
Diese Seite wurde automatisch vom maschinellen Übersetzungsdienst von Microsoft Translator übersetzt. Weitere Informationen

Microsoft Translator Blog

Azure AI Custom Translator Neural Dictionary: Höhere Qualität bei der Terminologieübersetzung 

Wir freuen uns sehr, heute die Veröffentlichung des neuronalen Wörterbuchs bekannt zu geben, eine signifikante Verbesserung der Übersetzungsqualität unserer Plattform. In diesem Blogbeitrag werden wir die Funktion des neuronalen Wörterbuchs untersuchen.

Einleitung  

Das neuronale Wörterbuch ist eine Erweiterung unseres Dynamisches Wörterbuch Und Phrasen-Wörterbuch Features in Azure AI Translator. Beide ermöglichen es unseren Benutzern, die Übersetzungsausgabe anzupassen, indem sie ihre eigenen Übersetzungen für bestimmte Begriffe oder Phrasen bereitstellen. Unsere vorherige Methode verwendete ein wörtliches Wörterbuch, bei dem es sich um eine exakte Suchen-und-Ersetzen-Operation handelte. Das neuronale Wörterbuch verbessert die Übersetzungsqualität von Sätzen, die eine oder mehrere Begriffsübersetzungen enthalten können, indem das maschinelle Übersetzungsmodell sowohl den Begriff als auch den Kontext anpassen kann, um eine flüssigere Übersetzung zu erzielen. Gleichzeitig bleibt die hohe Genauigkeit der Terminübersetzung erhalten.  

Das folgende englisch-deutsche Beispiel zeigt die Unterschiede in der Übersetzungsausgabe zwischen beiden Methoden, wenn eine benutzerdefinierte Terminologieübersetzung angefordert wird: 

Eingabe:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Wortwörtliches Wörterbuch:   Grundkenntnisse der regelmäßiges TestDe 
Neuronales Wörterbuch:   Grundkenntnisse des regelmäßigDe TestEns 

Qualitätsverbesserung 

Die folgende Grafik veranschaulicht die erheblichen Verbesserungen, die die neue Funktion gegenüber gängigen, öffentlich verfügbaren Terminologietestsätzen in der Automobilindustrie (https://aclanthology.org/2021.eacl-main.271), Gesundheit (https://aclanthology.org/2021.emnlp-main.477) und Covid-19-Bereiche (https://aclanthology.org/2021.wmt-1.69) unter Verwendung unserer allgemeinen Übersetzungsmodelle. 

Wir haben auch eine Reihe von Kundenbewertungen zur Custom Translator-Plattform und zu neuronalen Wörterbuchmodellen durchgeführt. Wir haben die Zuwächse bei der Übersetzungsqualität von Kundendaten zwischen Modellen mit und ohne die neuronale Wörterbucherweiterung gemessen. Fünf Kunden nahmen teil, die Deutsch, Spanisch und Französisch in verschiedenen Geschäftsbereichen abdeckten.

Die folgende Grafik zeigt die durchschnittliche Verbesserung der KOMET im Bildungsbereich für Englisch-Deutsch, Englisch-Spanisch und Englisch-Französisch; für allgemeine Modelle auf der linken Seite und für kundenspezifische Modelle auf der rechten Seite. BLAUE Farbbalken stellen die allgemeine Übersetzungsqualität ohne neuronales Wörterbuch dar und orangefarbene Farbbalken stellen die Übersetzungsqualität mit neuronalem Wörterbuch dar. Dabei handelt es sich um durchschnittliche Verbesserungen der gesamten Testsätze. Bei Segmenten mit einem oder mehreren Wörterbucheinträgen eines Kunden (zwischen 19 % und 63 %) beträgt die Verbesserung sogar +6,3 bis +12,9 COMET-Punkte. 

 Unterstützte Sprachen  

  • Aktuell verfügbar (Stand: 6. Dezember 2023): Chinesisch (vereinfacht), Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Polnisch, Russisch, Spanisch und Schwedisch – von und nach Englisch.  
  • Wir werden in Zukunft weitere hinzufügen. Informationen zu Aktualisierungen finden Sie unter Versionshinweise für benutzerdefinierte Übersetzer 

Funktionsweise des neuronalen Wörterbuchs 

Das neuronale Wörterbuch verwendet bei der Verarbeitung der benutzerdefinierten Terminologieübersetzung nicht den exakten Suchen-und-Ersetzen-Vorgang. Stattdessen werden Begriffe oder Phrasen aus dem Wörterbuch so übersetzt, dass sie am besten zum gesamten Kontext passen. Das bedeutet, dass der Begriff flektiert werden kann oder eine andere Groß-/Kleinschreibung haben kann, oder dass die umgebenden Wörter angepasst werden können, um eine flüssigere und kohärentere Übersetzung zu erhalten.  

Nehmen wir zum Beispiel an, wir haben den folgenden Eingabesatz auf Englisch und seine Übersetzung ins Polnische ohne Wörterbuchphrasen lautet wie folgt:  

Eingabe:   Wir brauchen eine schnelle Lösung, die verständlich ist.  
Standardübersetzung:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Wenn Sie sicherstellen möchten, dass "Lösung" als "alternatywa" ("eine Alternative" auf Englisch), können Sie eine dynamische Wörterbuchanmerkung hinzufügen, um Folgendes zu erreichen:  

Eingabe:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Wortwörtliches Wörterbuch:   Potrzebujemy szybkiEgo alternatywa, który będzie zrozumiały.  
Neuronales Wörterbuch:   Potrzebujemy szybkiEJ alternierendWy, która będzie zrozumiała.  

Die von der vorherigen Methode erzeugte Ausgabe ist nicht flüssig, da die grammatikalische Konsistenz des Geschlechts verletzt wird. Das neuronale Wörterbuch erzeugt eine flüssige Ausgabe, indem es a) die angeforderte Ersetzung beugt und b) die umgebenden Wörter bei Bedarf ändert. In einigen Fällen kann auch die Groß-/Kleinschreibung geändert werden, wie im folgenden Beispiel:  

Eingabe:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Wortwörtliches Wörterbuch:   akcje tej firmy scherzen dankeNi.  
Neuronales Wörterbuch:   Akcje tej firmy dankenie.   

Das neuronale Wörterbuch erwartet, dass die angeforderte Übersetzung eines Begriffs in seiner grammatikalischen Ausgangsform bereitgestellt wird. Mehrwortbegriffe werden ebenfalls unterstützt und sollten als Substantivphrasen angegeben werden, d. h. Wörter sollten nicht unabhängig voneinander lemmatisiert werden (z. B. ist "Estnische Parlamentswahl" besser als "Estnische Parlamentswahl"). 

So aktivieren Sie das neuronale Wörterbuch 

Für alle oben aufgeführten unterstützten Sprachen ist das neuronale Wörterbuch sofort für alle Kunden verfügbar, die die Custom Translator-Plattform mit Phrasen-Wörterbücher. Ein vollständiges (oder nur ein Wörterbuch) benutzerdefiniertes Modelltraining ist erforderlich, um das neuronale Wörterbuch zu aktivieren. 

 Empfehlungen 

  1. Wenn Sie sicherstellen möchten, dass der Phrasenwörterbucheintrag bei der Arbeit mit dem neuronalen Wörterbuch häufiger verwendet wird, können Sie den Phraseneintrag mit dem Quellteil in verschiedenen Formen hinzufügen. Im obigen Beispiel wird neben "Lösung _ alternatywa", können Sie auch die folgenden Einträge hinzufügen: "Lösung _ alternatywa", "Lösungen _ alternatywy", "Lösungen _ alternatywy”.  
  2. Wenn das Ziel darin besteht, sicherzustellen, dass ein bestimmtes Wort oder eine bestimmte Phrase "wie besehen" aus dem Eingabetext in die Ausgabeübersetzung kopiert wird, sollten Sie die Erzwingung eines wörtlichen Wörterbuchs in Betracht ziehen, da es möglicherweise konsistenter ist.   
  3. Vermeiden Sie es, dem Phrasenwörterbuch Übersetzungen von gebräuchlichen oder häufigen Wörtern oder Ausdrücken hinzuzufügen.  

Um mehr über Custom Translator zu erfahren und wie er Ihrem Unternehmen helfen kann, auf dem globalen Markt erfolgreich zu sein, beginnen Sie mit dem Custom Translator Anfängerleitfaden. 

Was Sie mit Microsoft Custom Translator tun können 

Erstellen Sie benutzerdefinierte Modelle mit Ihrer domänenspezifischen Terminologie und übersetzen Sie in Echtzeit mit dem Microsoft Translator-API. 

Verwenden Benutzerdefinierter Microsoft-Übersetzer mit Ihren Übersetzungslösungen, um Ihr Unternehmen zu globalisieren und die Kundeninteraktionen zu verbessern. 

Weitere Informationen finden Sie unter Microsoft Translator-Lösungen für Unternehmen Und Versionshinweise für benutzerdefinierte Übersetzer.