Перейти до основного
Перекладач
Ця сторінка була автоматично переведена на службу машинного перекладу Microsoft перекладача. Дізнатися більше

Microsoft Перекладач блог

Тестування якості перекладу: гість блог

Anand Chicravarty є SDET на машинного перекладу команди протягом останніх 2,5 років, був в Microsoft протягом 8 років, і був першим продуктом тестер по MT команди (і "ще весело з тестуванням MT:-)").  Гість блог сьогодні становить близько тестування якості перекладу. 

—————————————————————————————————————

Один з перших моментів, що спадає на думку, коли мова йде про перевірку якості системи перекладу, як ви оцінюєте якість, або бути точним, точність перекладу? Переклад між людськими мовами за допомогою комп'ютерів-це поле, яке майже півсторіччя. Області є досить складною, що навіть кращі в даний час доступні системи машинного перекладу не близькі до отримання лінгвістичної якості, які будуть повністю задовільними.

Частиною завдання є багато різних даних-точок, що люди процесу, з тим щоб зрозуміти значення розмовного/письмового тексту. Існує синтаксис, розбір, семантика, контекст, чисельні, перевпорядкування, всі з яких, і більше, йти в розумінні покарання. І це лише речення в 1 мові. Тепер розглянемо застосування всього цього, щоб перебудувати вирок на іншій мові і зробити його однаково значущою.

Деякі приклади можуть допомогти зробити цю точку чіткішими. Термін "Олімпійські ігри 2008" є досить однозначним. Аналогічним чином, можна очікувати, що термін "Вибори 2008" означає президентські вибори в США. Однак, якщо користувач з, скажімо, Канада, було б більш імовірно, послатися на місцеві вибори там.

Більш загальні, і, отже, більш поширені, наприклад, вирок, як "Примітка помилявся". Чи є слово "Примітка" посилання на інформативне повідомлення або музичного терміна? Належний переклад залежить від контексту. Використовуйте більше контексту, і ваші шанси отримати більш точний переклад поліпшуватися. Це, однак, відбувається в вартості: чим більше контекст система намагається отримати, тим повільніше його продуктивність. Smart транспортні рішення залучати зробити правильний баланс між поліпшенням точності перекладу і доставки працездатним результат перекладу для користувачів. Звичайно, обидва мають важливе значення. Ключовим є розуміння того, де ви прямим зусиллям на поліпшення в залежності від того, наскільки корисним кінцевим результатом є користувач.

Це стає особливо цікавим при перекладі документів або веб-сторінок, а не лише індивідуальних речень. Скажімо, запит на переклад отримано на веб-сторінці, яка містить 100 речень. Залежно від архітектури системи перекладу, ці речення можуть йти в один процес, або бути розподілені між декількома процесами/машинами. У будь-якому випадку, ясно, що час, прийнятих для перекладу цієї сторінки в повному обсязі пропорційний до максимального часу, прийнятих для перекладу вироку. Як довго ми проводимо переклад речення до цього вклали час стає згубним для користувача час? У гонитві за кращим перекладом, ми могли б в кінцевому підсумку блокування користувача від отримання нічого інформативним у відповідь на їх прохання перекладу. Таким чином, утиліта системи регулюється рішеннями, які робляться для балансу лінгвістичної якості та ефективності застосування.

З продуктом перекладача Microsoft, існує додаткова особливість нашого двомовного глядача, щось унікальне серед публічно доступних продуктів перекладу. Він підтримує паралельне підсвічування тексту, синхронізований прокрутка і представляє сторінки (и) з прогресивною візуалізацією. Це додасть ще одного шару до того, що наші користувачі бачать, і, отже, ще один шар на польську і обробку.

У найближчі тижні ми сподіваємося принести вам більш докладну інформацію про конкретних областях, які були і в даний час перевірені на судно вищої якості перекладу системи. Не соромтеся розміщувати будь-які питання, у вас на цьому питанні, то ви завжди хотіли запитати:-), в розділі коментарів.