Mašīntulkošanas grupa programmā Microsoft Research
Microsoft Research ' s Machine translation (MSR-MT) grupa ir starp vadošajiem pētniecības organizācijām mašīntulkošanas telpā vairāk nekā 8 gadus, un daži no pamatus darbu dabiskās valodas apstrādi MSR sākās vairāk nekā 16 gadus atpakaļ. Komandu pieeja mašīntulkošanai integrē lingvistiskās funkcijas ar jaunākajiem statistiskās mašīntulkošanas algoritmiem. Komandas uzmanības centrā vienmēr ir bijusi automātiska tulkošanas zināšanu iegūšana no divvalodu korporiem, t.i., paralēliem datiem, kas sastāv no oriģinālvalodas teikumiem un to atbilstošajiem tulkojumiem. Apmēram 3 gadus atpakaļ, komandas uzmanības novirzīta no tīri noteikumu balstītu pieeju šim uzdevumam pret hibrīda pieeju, kas ietver plašu statistisko apstrādi, kas ļauj lielāku mērogojamību dažādās jomās un jaunās valodās.
Microsoft mašīntulkošanas tehnoloģija pirmoreiz tika izstrādāta, lai nodrošinātu uzņēmuma Atļaut mūsu klientu atbalsta organizācija, lai publicētu tehniskā atbalsta dokumentus ar frekvenci un valodas plašumu, kas būtu bijis pārmērīgi dārgs, izmantojot cilvēku tulkotājus. Ar visiem Microsoft iepriekš cilvēku tulkoto dokumentu un lokalizēta programmatūra tās rīcībā, MT komanda varēja automātiski apmācīt savu statistisko MT dzinēju, lai sasniegtu diezgan labas kvalitātes tehniskā jomā. Šī tehnoloģija tika paplašināta, lai atbalstītu Windows lokalizācijas darba grupu, izstrādātāju nodaļu, MSDN un vairākas citas grupas korporācijas Microsoft ietvaros. Tā ir arī ļāvusi korporācijai Microsoft sasniegt daudz vairāk klientu, nekā jebkad būtu bijis iespējams izmantot cilvēku tulkojumu atsevišķi.
Pēc tam, koncentrējoties uz Microsoft pašu tulkošanas vajadzībām, komanda sāka veidot mērogojamu interneta pakalpojumu, kas ļautu tai sniegt tulkošanas pakalpojumus plašai sabiedrībai, kā standalone rīks tīmeklī, kā arī citu produktu iezīme. Ņemot vērā to, ka Microsoft MT dzinējs ir apmācīts visvairāk par tehniskajiem datiem, tas vēl nav noregulētas tulkojot tekstu citās jomās. Tomēr mēs ceram turpināt uzlabot kvalitāti un plašumu motoru. Mēs ceram dalīties mūsu attīstību ar jums vairāk nekā tuvākajos mēnešos par šo emuāru.
--Virši