Pengujian kualitas terjemahan: Guest blog
Anand Chakravarty adalah SDET pada tim mesin penerjemahan selama 2,5 tahun, telah di Microsoft selama 8 tahun, dan merupakan penguji produk pertama pada tim MT (dan "masih bersenang-senang dengan pengujian MT:-)"). Tamu hari ini blog adalah tentang pengujian kualitas terjemahan.
—————————————————————————————————————
Salah satu poin pertama yang muncul dalam pikiran, ketika berbicara tentang memverifikasi kualitas sistem terjemahan, adalah bagaimana Anda mengukur kualitas, atau tepatnya, akurasi terjemahan? Menerjemahkan antara bahasa manusia menggunakan komputer adalah bidang yang hampir setengah-abad tua. Daerah ini cukup menantang bahwa bahkan yang terbaik saat ini tersedia sistem terjemahan mesin tidak dekat untuk mendapatkan kualitas linguistik yang akan sepenuhnya memuaskan.
Bagian dari tantangan adalah banyak data-poin yang berbeda bahwa manusia proses dalam rangka untuk memahami makna lisan/teks tertulis. Ada sintaks, parsing, semantik, konteks, disambiguasi, penataan kembali, yang semuanya, dan banyak lagi, masuk ke dalam memahami kalimat. Dan ini hanya kalimat dalam 1 bahasa. Sekarang mempertimbangkan menerapkan semua itu untuk membangun kembali kalimat dalam bahasa lain dan membuatnya sama-sama bermakna.
Beberapa contoh mungkin membantu untuk membuat titik ini lebih jelas. Istilah ' Olimpiade 2008 ' cukup ambigu. Demikian pula, orang mungkin mengharapkan istilah ' Pemilu 2008 ' berarti pemilihan Presiden di Amerika Serikat. Namun, jika pengguna dari, katakanlah, Kanada, itu akan lebih mungkin merujuk pada pemilu lokal di sana.
Yang lebih umum, dan karenanya lebih umum, contoh adalah kalimat seperti ' catatan itu salah '. Apakah kata ' catatan ' adalah referensi ke pesan informatif atau istilah musik? Terjemahan yang tepat tergantung pada konteks. Gunakan lebih banyak konteks, dan kesempatan Anda untuk mendapatkan terjemahan yang lebih akurat membaik. Namun ini datang dengan biaya: semakin konteks sistem mencoba untuk mendapatkan, semakin lambat kinerjanya. Keputusan pengiriman cerdas melibatkan membuat keseimbangan yang tepat antara meningkatkan akurasi terjemahan dan memberikan hasil terjemahan yang dapat dikerjakan kepada pengguna. Tentu saja, keduanya penting. Kuncinya adalah untuk memahami di mana Anda upaya langsung pada perbaikan tergantung pada bagaimana berguna hasil akhir adalah kepada pengguna.
Hal ini menjadi sangat menarik ketika menerjemahkan dokumen atau halaman web, bukan hanya kalimat individual. Mari kita mengatakan permintaan terjemahan telah diterima untuk halaman web yang berisi 100 kalimat. Tergantung pada arsitektur sistem terjemahan, kalimat ini semua bisa pergi ke satu proses, atau didistribusikan di beberapa proses/mesin. Either way, jelas bahwa waktu yang dibutuhkan untuk menerjemahkan halaman ini secara keseluruhan sebanding dengan waktu maksimum yang diambil untuk menerjemahkan kalimat. Berapa lama kita menghabiskan menerjemahkan kalimat sebelum itu menginvestasikan waktu menjadi merugikan pengguna waktu? Dalam mengejar terjemahan terbaik, kita mungkin berakhir memblokir pengguna dari mendapatkan sesuatu yang informatif dalam menanggapi permintaan terjemahan mereka. Utilitas dari sistem ini dengan demikian diatur oleh keputusan yang dibuat untuk menyeimbangkan kualitas linguistik dan kinerja aplikasi.
Dengan produk Microsoft Translator, ada fitur tambahan dari penampil dwibahasa kami, sesuatu yang unik di antara produk terjemahan yang tersedia secara publik. Mendukung penyorotan teks paralel, disinkronkan bergulir dan menyajikan halaman (s) dengan render progresif. Ini menambahkan lapisan lain untuk apa yang pengguna kita lihat, dan akibatnya lapisan lain untuk memoles dan menyelesaikan.
Dalam beberapa minggu mendatang, kami berharap dapat memberi Anda lebih banyak rincian tentang area tertentu dan sedang diuji untuk mengirimkan sistem penerjemahan berkualitas tinggi. Jangan ragu untuk memposting pertanyaan yang Anda miliki tentang hal ini, sesuatu yang selalu ingin bertanya:-), di bagian komentar.