Azure AI Custom Translator Νευρωνικό λεξικό: Ποιότητα μετάφρασης υψηλότερης ορολογίας
Σήμερα, είμαστε ενθουσιασμένοι που ανακοινώνουμε την κυκλοφορία του νευρωνικού λεξικού, μια σημαντική βελτίωση της ποιότητας της μετάφρασης στην πλατφόρμα μας. Σε αυτή τη δημοσίευση στο ιστολόγιο, θα εξερευνήσουμε τη λειτουργία του νευρωνικού λεξικού.
Εισαγωγή
Το νευρωνικό λεξικό είναι μια επέκταση του δυναμικό λεξικό Και λεξικό φράσεων χαρακτηριστικά στο Azure AI Translator. Και οι δύο επιτρέπουν στους χρήστες μας να προσαρμόζουν την έξοδο της μετάφρασης παρέχοντας τις δικές τους μεταφράσεις για συγκεκριμένους όρους ή φράσεις. Η προηγούμενη μέθοδός μας χρησιμοποιούσε λεξικό κατά λέξη, το οποίο ήταν μια ακριβής λειτουργία εύρεσης και αντικατάστασης. Το νευρωνικό λεξικό βελτιώνει την ποιότητα της μετάφρασης για προτάσεις που μπορεί να περιλαμβάνουν μία ή περισσότερες μεταφράσεις όρων, αφήνοντας το μοντέλο αυτόματης μετάφρασης να προσαρμόσει τόσο τον όρο όσο και το πλαίσιο για να παράγει πιο ρευστή μετάφραση. Ταυτόχρονα, διατηρεί την υψηλή ακρίβεια μετάφρασης όρων.
Το ακόλουθο παράδειγμα αγγλικών-γερμανικών δείχνει τις διαφορές στα αποτελέσματα της μετάφρασης μεταξύ των δύο μεθόδων όταν ζητείται μετάφραση προσαρμοσμένης ορολογίας:
Εισαγωγή: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Λεξικό Verbatim: | Grundkenntnisse der τακτικάEs Δοκιμήen |
Νευρωνικό λεξικό: | Grundkenntnisse des τακτικάen Δοκιμήens |
Βελτίωση της ποιότητας
Το παρακάτω διάγραμμα απεικονίζει τις σημαντικές βελτιώσεις που επιφέρει η νέα λειτουργία σε κοινά δημόσια διαθέσιμα σύνολα δοκιμών ορολογίας στον τομέα της αυτοκινητοβιομηχανίας (https://aclanthology.org/2021.eacl-main.271), Υγεία (https://aclanthology.org/2021.emnlp-main.477) και τους τομείς Covid-19 (https://aclanthology.org/2021.wmt-1.69) με τη χρήση των γενικών μεταφραστικών μοντέλων μας.
Πραγματοποιήσαμε επίσης μια σειρά αξιολογήσεων πελατών στην πλατφόρμα Custom Translator και στα μοντέλα νευρωνικών λεξικών. Μετρήσαμε την αύξηση της ποιότητας της μετάφρασης σε δεδομένα πελατών μεταξύ μοντέλων με και χωρίς την επέκταση του νευρωνικού λεξικού. Συμμετείχαν πέντε πελάτες, οι οποίοι κάλυπταν τα γερμανικά, τα ισπανικά και τα γαλλικά σε διαφορετικούς επιχειρηματικούς τομείς.
Το παρακάτω διάγραμμα δείχνει τη μέση βελτίωση των COMET στον τομέα της εκπαίδευσης για τα Αγγλικά-Γερμανικά, τα Αγγλικά-Ισπανικά και τα Αγγλικά-Γαλλικά- για τα γενικά μοντέλα στα αριστερά και για τα προσαρμοσμένα μοντέλα στα δεξιά. Οι ΜΠΛΕ χρωματικές μπάρες αντιπροσωπεύουν τη γενική ποιότητα μετάφρασης χωρίς νευρωνικό λεξικό και οι ΠΟΡΤΟΚΑΛΙ χρωματικές μπάρες αντιπροσωπεύουν την ποιότητα μετάφρασης με χρήση νευρωνικού λεξικού. Πρόκειται για συνολικές μέσες βελτιώσεις σε όλα τα σύνολα δοκιμών. Για τα τμήματα που περιλαμβάνουν μία ή περισσότερες καταχωρίσεις λεξικού του πελάτη (μεταξύ 19% και 63%), η βελτίωση φτάνει τις +6,3 έως +12,9 μονάδες COMET.
Υποστηριζόμενες γλώσσες
- Επί του παρόντος διαθέσιμο (από τις 6 Δεκεμβρίου 2023): Κινέζικα απλοποιημένα, γαλλικά, γερμανικά, ιταλικά, ιαπωνικά, κορεατικά, πολωνικά, ρωσικά, ισπανικά και σουηδικά - από και προς τα αγγλικά.
- Θα προσθέσουμε κι άλλες στο μέλλον. Για ενημερώσεις, ανατρέξτε στη διεύθυνση Σημειώσεις έκδοσης προσαρμοσμένου μεταφραστή.
Πώς λειτουργεί το νευρωνικό λεξικό
Το νευρωνικό λεξικό δεν χρησιμοποιεί την ακριβή λειτουργία εύρεσης και αντικατάστασης όταν χειρίζεται τη μετάφραση προσαρμοσμένης ορολογίας. Αντ' αυτού, μεταφράζει όρους ή φράσεις από το λεξικό με τρόπο που ταιριάζει καλύτερα σε ολόκληρο το πλαίσιο. Αυτό σημαίνει ότι ο όρος μπορεί να κλίνει ή να έχει διαφορετικό περιτύπωμα ή ότι οι περιβάλλουσες λέξεις μπορούν να προσαρμοστούν, παράγοντας μια πιο ρευστή και συνεκτική μετάφραση.
Ας πούμε, για παράδειγμα, ότι έχουμε την ακόλουθη πρόταση εισόδου στα αγγλικά και η μετάφρασή της στα πολωνικά χωρίς φράσεις λεξικού έχει ως εξής:
Εισαγωγή: | Χρειαζόμαστε μια γρήγορη λύση που θα είναι κατανοητή. |
Τυπική μετάφραση: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Αν θέλετε να βεβαιωθείτε ότι το "solution" μεταφράζεται ως "alternatywa" ("an alternative" στα αγγλικά), μπορείτε να προσθέσετε μια δυναμική σημείωση λεξικού για να το πετύχετε αυτό:
Εισαγωγή: | We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable. |
Λεξικό Verbatim: | Potrzebujemy szybkiego alternatywa, który będzie zrozumiały. |
Νευρωνικό λεξικό: | Potrzebujemy szybkiej εναλλαγήwy, którA będzie zrozumiałA. |
Το αποτέλεσμα που παράγεται από την προηγούμενη μέθοδο δεν είναι ευφράδεια, καθώς παραβιάζεται η γραμματική συνοχή του γένους. Το νευρωνικό λεξικό παράγει ρευστή έξοδο με α) την κλίση της ζητούμενης αντικατάστασης και β) την αλλαγή των περιβαλλουσών λέξεων όπου χρειάζεται. Μπορεί επίσης να αλλάξει το περιτύπωμα σε ορισμένες περιπτώσεις, όπως στο ακόλουθο παράδειγμα:
Εισαγωγή: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Λεξικό Verbatim: | akcje tej firmy jest tani. |
Νευρωνικό λεξικό: | Akcje tej firmy są tanie. |
Το νευρωνικό λεξικό αναμένει ότι η ζητούμενη μετάφραση ενός όρου παρέχεται στη βασική γραμματική του μορφή. Υποστηρίζονται επίσης πολυλεκτικοί όροι, οι οποίοι θα πρέπει να παρέχονται ως ουσιαστικές φράσεις, δηλαδή οι λέξεις δεν θα πρέπει να λημματογραφούνται ανεξάρτητα (για παράδειγμα, το "Estonian parliamentary election" θα είναι καλύτερο από το "Estonia parliament election").
Πώς να ενεργοποιήσετε το νευρωνικό λεξικό
Για όλες τις υποστηριζόμενες γλώσσες που αναφέρονται παραπάνω, το νευρωνικό λεξικό είναι άμεσα διαθέσιμο για όλους τους πελάτες που χρησιμοποιούν την πλατφόρμα Custom Translator με λεξικά φράσεων. Απαιτείται πλήρης (ή μόνο λεξικό) επανεκπαίδευση προσαρμοσμένου μοντέλου για την ενεργοποίηση του νευρωνικού λεξικού.
Συστάσεις
- Αν θέλετε να διασφαλίσετε ότι η καταχώρηση του λεξικού φράσεων χρησιμοποιείται συχνότερα κατά την εργασία με το νευρωνικό λεξικό, μπορείτε να εξετάσετε το ενδεχόμενο να προσθέσετε την καταχώρηση φράσεων με το τμήμα πηγής σε διάφορες μορφές. Στο παραπάνω παράδειγμα, δίπλα στο "solution _ alternatywa", ίσως θελήσετε να προσθέσετε και τις ακόλουθες καταχωρήσεις: "Λύση _ alternatywa", "solutions _ alternatywy", "Λύσεις _ alternatywy".
- Εάν ο στόχος είναι να διασφαλιστεί ότι μια συγκεκριμένη λέξη ή φράση αντιγράφεται "ως έχει" από το κείμενο εισόδου στη μετάφραση εξόδου κατά τη χρήση του λεξικού φράσεων, εξετάστε το ενδεχόμενο να επιβάλλετε το λεξικό κατά λέξη, καθώς μπορεί να είναι πιο συνεπές.
- Αποφύγετε την προσθήκη μεταφράσεων κοινών ή συχνών λέξεων ή φράσεων στο λεξικό φράσεων.
Για να μάθετε περισσότερα για τον Προσαρμοσμένο μεταφραστή και πώς μπορεί να βοηθήσει την επιχείρησή σας να ευδοκιμήσει στην παγκόσμια αγορά, ξεκινήστε με το Οδηγός για αρχάριους Custom Translator.
Τι μπορείτε να κάνετε με το Προσαρμοσμένο πρόγραμμα μετάφρασης της Microsoft
Κατασκευάστε προσαρμοσμένα μοντέλα με την ορολογία του τομέα σας και μεταφράστε σε πραγματικό χρόνο χρησιμοποιώντας το API μετάφρασης της Microsoft.
Χρησιμοποιήσετε Προσαρμοσμένος μεταφραστής της Microsoft με τις μεταφραστικές σας λύσεις για να βοηθήσετε στην παγκοσμιοποίηση της επιχείρησής σας και στη βελτίωση των αλληλεπιδράσεων με τους πελάτες.
Για περισσότερες πληροφορίες, επισκεφθείτε την ιστοσελίδα Επιχειρηματικές λύσεις Microsoft Translator Και Σημειώσεις έκδοσης προσαρμοσμένου μεταφραστή.