Έλεγχος ποιότητας μετάφρασης: blog επισκεπτών
Ο Ανάντ Τσακράτατυ είναι ένας SDET στην ομάδα μηχανικής μετάφρασης για τα τελευταία 2,5 χρόνια, βρίσκεται στη Microsoft για 8 χρόνια, και ήταν ο πρώτος δοκιμαστής προϊόντων στην ομάδα MT (και "εξακολουθεί να διασκεδάζει με τις δοκιμές MT:-)"). Το σημερινό blog των καλεσμένων είναι για τον έλεγχο της ποιότητας μετάφρασης.
—————————————————————————————————————
Ένα από τα πρώτα σημεία που έρχονται στο μυαλό, όταν μιλάμε για την επαλήθευση της ποιότητας ενός μεταφραστικού συστήματος, είναι πώς μετράτε την ποιότητα, ή για να είμαστε ακριβείς, την ακρίβεια της μετάφρασης; Η μετάφραση μεταξύ των ανθρώπινων γλωσσών που χρησιμοποιούν υπολογιστές είναι ένα πεδίο που είναι σχεδόν μισού αιώνα. Η περιοχή είναι αρκετά προκλητική ώστε ακόμη και τα καλύτερα διαθέσιμα συστήματα μηχανικής μετάφρασης δεν είναι κοντά στην απόκτηση γλωσσικής ποιότητας που θα ήταν απολύτως ικανοποιητική.
Μέρος της πρόκλησης είναι τα πολλά διαφορετικά σημεία δεδομένων που επεξεργάζονται οι άνθρωποι για να κατανοήσουν την έννοια του προφορικό/γραπτού κειμένου. Υπάρχει η σύνταξη, η ανάλυση, η σημασιολογία, το περιβάλλον, η αποσαφήνιση, η αναδιάταξη, τα οποία, και πολλά άλλα, πηγαίνουν στην κατανόηση μιας πρότασης. Και αυτή είναι μόνο η πρόταση σε 1 γλώσσα. Τώρα εξετάστε το ενδεχόμενο να εφαρμόσετε όλα αυτά για να ξαναχτίσετε την πρόταση σε μια άλλη γλώσσα και να την κάνετε εξίσου σημαντική.
Ορισμένα παραδείγματα μπορεί να βοηθήσουν να καταστεί αυτό το σημείο σαφέστερο. Ο όρος «Ολυμπιακοί Αγώνες 2008» είναι αρκετά σαφής. Ομοίως, θα μπορούσε κανείς να αναμένει ότι ο όρος «εκλογές 2008» θα σημαίνει τις προεδρικές εκλογές στις ΗΠΑ. Ωστόσο, εάν ο χρήστης είναι από τον Καναδά, ας πούμε, είναι πιθανότερο να αναφέρεται στις τοπικές εκλογές εκεί.
Ένα γενικότερο, και ως εκ τούτου πιο συνηθισμένο, παράδειγμα είναι μια πρόταση όπως "το σημείωμα ήταν λάθος". Είναι η λέξη "Σημείωση" μια αναφορά σε ένα ενημερωτικό μήνυμα ή σε έναν μουσικό όρο; Η σωστή μετάφραση εξαρτάται από το πλαίσιο. Χρησιμοποιήστε περισσότερο περιβάλλον, και τις πιθανότητές σας να πάρει μια πιο ακριβής μετάφραση βελτίωση. Αυτό όμως έρχεται με ένα κόστος: όσο περισσότερο περιβάλλον προσπαθεί να αποκτήσει το σύστημα, τόσο βραδύτερη είναι η απόδοσή του. Οι έξυπνες αποφάσεις αποστολής περιλαμβάνουν την επίτευξη της δεξιάς ισορροπίας μεταξύ της βελτίωσης της ακρίβειας της μετάφρασης και της παροχής ενός εφικτού αποτελέσματος μετάφρασης στους χρήστες. Φυσικά, και τα δύο είναι σημαντικά. Το κλειδί είναι να κατανοήσετε πού κατευθύνετε τις προσπάθειές σας για βελτίωση, ανάλογα με το πόσο χρήσιμο είναι το τελικό αποτέλεσμα για το χρήστη.
Αυτό γίνεται ιδιαίτερα ενδιαφέρον όταν μεταφράζετε έγγραφα ή ιστοσελίδες, αντί μόνο για μεμονωμένες προτάσεις. Ας πούμε ότι έχει ληφθεί ένα αίτημα μετάφρασης για μια ιστοσελίδα που περιέχει 100 προτάσεις. Ανάλογα με την αρχιτεκτονική του μεταφραστικού συστήματος, αυτές οι προτάσεις θα μπορούσαν να πάνε σε μία διαδικασία ή να διανεμηθούν σε πολλαπλές διεργασίες/μηχανήματα. Όπως και να έχει, είναι σαφές ότι ο χρόνος που απαιτείται για τη μετάφραση αυτής της σελίδας στο σύνολό της είναι ανάλογος με τον μέγιστο χρόνο που απαιτείται για τη μετάφραση μιας πρότασης. Πόσο καιρό δαπανούμε για να μεταφράσουμε μια πρόταση πριν από τον χρόνο που επένδυσαν σε βάρος του χρόνου του χρήστη; Κατά την αναζήτηση της καλύτερης μετάφρασης, μπορεί να καταλήξουμε να μπλοκάρουμε τον χρήστη από το να πάρει οτιδήποτε ενημερωτικό ως απάντηση στο αίτημά τους για μετάφραση. Έτσι, η χρησιμότητα του συστήματος διέπεται από αποφάσεις που λαμβάνονται για την εξισορρόπηση της γλωσσικής ποιότητας και της απόδοσης των εφαρμογών.
Με το προϊόν Μεταφραστής της Microsoft, υπάρχει το πρόσθετο χαρακτηριστικό του δίγλωσσων θεατή, κάτι μοναδικό μεταξύ των διαθέσιμων μεταφραστικών προϊόντων. Υποστηρίζει παράλληλη επισήμανση κειμένου, συγχρονισμένη κύλιση και παρουσιάζει τη σελίδα (ες) με προοδευτική απόδοση. Αυτό προσθέτει ένα άλλο επίπεδο σε αυτό που βλέπουν οι χρήστες μας, και κατά συνέπεια ένα άλλο επίπεδο για να γυαλίσει και να τελειώσει.
Τις προσεχείς εβδομάδες, ελπίζουμε να σας φέρουμε περισσότερες λεπτομέρειες σχετικά με συγκεκριμένους τομείς που ελέγχθηκαν και δοκιμάζονται για να στείλουν ένα υψηλής ποιότητας σύστημα μετάφρασης. Μην διστάσετε να δημοσιεύσετε οποιεσδήποτε ερωτήσεις που έχετε σχετικά με αυτό το θέμα, κάτι που πάντα ήθελε να ζητήσει:-), στο τμήμα σχόλια.