Maskinoversettelses gruppe hos Microsoft Research
Microsoft Research ' s Machine Translation (MSR-MT) gruppen har vært blant de ledende forskningsorganisasjoner i maskinen oversettelsen plass i over 8 år, og noen av de grunnleggende arbeidet i naturlig språk prosessering på MSR begynte over 16 år siden. Teamets tilnærming til maskin oversettelse integrerer språklige funksjoner med State-of-the-art statistiske maskin oversettelse algoritmer. Teamets fokus har alltid vært på automatisk innhenting av Oversettelses kunnskap fra tospråklige corpora, dvs. parallelle data bestående av originale kilde språk setninger og deres tilsvarende oversettelser av menneskelige oversettere. For ca 3 år siden, skiftet lagets fokus fra en rent regelbasert tilnærming til denne oppgaven mot en hybrid tilnærming som inkluderer omfattende statistisk prosessering, noe som åpner for større skalerbarhet på tvers av domener og inn i nye språk.
Microsofts Maskinoversettelses teknologi ble først utviklet for interne lokaliserings formål, for å Tillate vår kundestøtteorganisasjon til å publisere teknisk support dokumenter med en frekvens og språk bredde som ville vært uoverkommelig dyrt å bruke menneskelige oversettere. Med alle Microsofts tidligere menneske-oversatte dokumenter og lokaliserte programvare til rådighet, MT teamet var i stand til automatisk å trene sin statistiske MT motor for å oppnå ganske god kvalitet i det tekniske domenet. Denne teknologien ble utvidet til å støtte Windows lokalisering team, Developer Division, MSDN, og flere andre grupper i Microsoft. Det har også tillatt Microsoft å nå mange flere kunder enn det ville ha vært mulig å bruke menneskelig oversettelse alene.
Etter å ha fokusert på Microsofts egne Oversettelses behov, begynte teamet å bygge en skalerbar webtjeneste som ville tillate den å yte oversettelsestjenester til allmennheten, som en frittstående verktøy på nettet, og som en funksjon i andre produkter. Gitt at Microsoft MT motoren har blitt opplært mest tungt på tekniske data, er det ennå ikke er innstilt for å oversette tekst i andre domener. Men vi håper å fortsette å forbedre kvaliteten og bredden av motoren. Vi ser frem til å dele vår utvikling med deg i løpet av de kommende månedene på denne bloggen.
– Lyng