Prüfung der Übersetzungsqualität: Gast-Blog
Anand Chakravarty ist seit 2,5 Jahren SDET im Machine Translation Team, ist seit 8 Jahren bei Microsoft und war der erste Produkttester im MT-Team (und "immer noch Spaß am Testen von MT :-)"). Im heutigen Gast-Blog geht es darum, die Übersetzungsqualität zu testen.
—————————————————————————————————————
Einer der ersten Punkte, die einem in den Sinn kommen, wenn es um die Überprüfung der Qualität eines Übersetzungssystems geht, ist, wie misst man die Qualität, oder genauer gesagt, die Genauigkeit der Übersetzung? Die Übersetzung zwischen menschlichen Sprachen mit Hilfe von Computern ist ein Feld, das fast ein halbes Jahrhundert alt ist. Das Gebiet ist so herausfordernd, dass selbst die besten derzeit verfügbaren maschinellen Übersetzungssysteme nicht annähernd eine sprachliche Qualität erreichen, die völlig zufriedenstellend wäre.
Teil der Herausforderung sind die vielen verschiedenen Datenpunkte, die der Mensch verarbeitet, um die Bedeutung von gesprochenem und geschriebenem Text zu verstehen. Es gibt die Syntax, das Parsen, die Semantik, den Kontext, die Disambiguierung, die Neuordnung, die alle und noch mehr zum Verständnis eines Satzes führen. Und das ist nur der Satz in einer Sprache. Erwägen Sie nun, alles davon anzuwenden, um den Satz in einer anderen Sprache wiederherzustellen und ihn ebenso sinnvoll zu gestalten.
Einige Beispiele könnten helfen, diesen Punkt deutlicher zu machen. Der Begriff "Olympische Spiele 2008" ist ziemlich eindeutig. Ebenso könnte man erwarten, dass der Begriff "Wahlen 2008" die Präsidentschaftswahlen in den USA bezeichnet. Wenn der Nutzer jedoch beispielsweise aus Kanada kommt, würde er sich eher auf die dortigen Kommunalwahlen beziehen.
Ein allgemeineres und damit häufigeres Beispiel ist ein Satz wie "Die Note war falsch". Ist das Wort "Notiz" ein Hinweis auf eine informative Botschaft oder auf einen musikalischen Begriff? Die richtige Übersetzung hängt vom Kontext ab. Nutzen Sie mehr Kontext, und Ihre Chancen, eine genauere Übersetzung zu erhalten, verbessern sich. Dies hat jedoch seinen Preis: Je mehr Kontext das System zu erhalten versucht, desto langsamer ist seine Leistung. Intelligente Versandentscheidungen beinhalten die richtige Balance zwischen der Verbesserung der Genauigkeit der Übersetzung und der Bereitstellung eines praktikablen Übersetzungsergebnisses für die Benutzer. Natürlich sind beide wichtig. Der Schlüssel ist zu verstehen, wo Sie Ihre Verbesserungsbemühungen ansetzen, je nachdem, wie nützlich das Endergebnis für den Benutzer ist.
Dies wird besonders interessant bei der Übersetzung von Dokumenten oder Webseiten, anstatt nur einzelner Sätze. Nehmen wir an, es wurde ein Übersetzungsauftrag für eine Webseite mit 100 Sätzen erhalten. Abhängig von der Architektur des Übersetzungssystems können diese Sätze alle in einen Prozess gehen oder auf mehrere Prozesse/Maschinen verteilt werden. So oder so, es ist klar, dass die Zeit, die für die Übersetzung dieser Seite in ihrer Gesamtheit benötigt wird, proportional zur maximalen Zeit für die Übersetzung eines Satzes ist. Wie lange dauert es, bis wir einen Satz übersetzen, bevor die investierte Zeit die Zeit des Benutzers beeinträchtigt? Um die beste Übersetzung zu erhalten, könnten wir den Benutzer daran hindern, etwas Informatives als Antwort auf seinen Übersetzungswunsch zu erhalten. Der Nutzen des Systems wird somit durch Entscheidungen bestimmt, die getroffen werden, um Sprachqualität und Anwendungsleistung in Einklang zu bringen.
Mit dem Microsoft Translator-Produkt gibt es die zusätzliche Funktion unseres zweisprachigen Viewers, etwas Einzigartiges unter den öffentlich verfügbaren Übersetzungsprodukten. Es unterstützt paralleles Hervorheben von Texten, synchronisiertes Scrollen und präsentiert die Seite(n) mit progressivem Rendering. Dies fügt dem, was unsere Anwender sehen, eine weitere Schicht hinzu, und damit eine weitere Schicht zum Polieren und Veredeln.
In den kommenden Wochen möchten wir Ihnen weitere Details zu bestimmten Bereichen mitteilen, die getestet wurden und werden, um ein qualitativ hochwertiges Übersetzungssystem zu liefern. Zögere nicht, Fragen zu diesem Thema zu stellen, die du schon immer stellen wolltest :-), im Abschnitt Kommentare.