Mașină de traducere grup la Microsoft Research
Microsoft Research ' s Machine traducere (MSR-MT) grup a fost printre organizațiile de cercetare de conducere în spațiul de traducere mașină de peste 8 ani, iar unele dintre activitatea fundamentală în procesarea limbajului natural la MSR a început peste 16 ani în urmă. Abordarea echipei de traducere a mașinii integrează caracteristici lingvistice cu algoritmi de traducere statistică de ultimă ora. Accentul echipei a fost întotdeauna pe dobândirea automată a cunoștințelor de traducere de la corpora bilingvă, și anume, date paralele constând din fraze de limba originală sursă și traducerile lor corespunzătoare de către traducători umane. În urmă cu aproximativ 3 ani, echipa s-a concentrat de la o abordare pur bazată pe reguli a acestei sarcini către o abordare hibridă care include o procesare statistică extinsă, permițând o scalabilitate mai mare între domenii și în noi limbi.
Tehnologia Microsoft de traducere automată a fost dezvoltată pentru prima dată în scopul localizării Permite Organizația noastră de asistență pentru clienți pentru a publica documente de suport tehnic cu o frecvență și lățime de limbă care ar fi fost prohibitiv costisitoare folosind traducători umani. Cu toate documentele Microsoft anterior tradus uman și software-ul localizat la dispoziția sa, echipa MT a fost capabil în mod automat de tren sale statistice motor MT pentru a realiza destul de bună calitate în domeniul tehnic. Această tehnologie a fost extinsă pentru a sprijini echipa de localizare Windows, Divizia Developer, MSDN și alte câteva grupuri din cadrul Microsoft. Ea a permis, de asemenea, Microsoft pentru a ajunge la mai mulți clienți decât ar fi fost vreodată posibil folosind traducere umană singur.
După ce s-a axat pe nevoile de traducere proprii ale Microsoft, echipa a început să construiască un serviciu Web scalabil care i-ar permite să furnizeze servicii de traducere publicului larg, ca instrument independent pe web, și ca o caracteristică în cadrul altor produse. Având în vederea că motorul Microsoft MT a fost instruit cel mai mult pe date tehnice, acesta nu a fost încă reglat pentru traducerea textului în alte domenii subiect. Cu toate acestea, sperăm să continuăm să îmbunătățim calitatea și lățimea motorului. Așteptăm cu nerăbdare să împărtășim evoluțiile noastre cu tine în lunile următoare pe acest blog.
– Heather