Pereiti prie pagrindinio turinio
Vertėjas
Šis puslapis automatiškai išverstas į "Microsoft Translator" mašininio vertimo tarnybą. Sužinokite daugiau

Mašininio vertimo

Kas yra mašininio vertimo?

Mašininio vertimo sistemos – tai taikomosios programos arba internetinės tarnybos, kurios naudoja kompiuterio mokymo technologijas, kad išverstų didelius teksto kiekius iš bet kurios jų palaikomos kalbos. Tarnyba verčia "šaltinio" tekstą iš vienos kalbos į kitą "paskirties" kalba.

Nors už mašininio vertimo technologiją ir sąsajas ją naudoti yra gana paprasta, mokslas ir technologijos yra labai sudėtingi ir sutelkia kelias moderniausias technologijas, ypač gilų mokymąsi ( duomenų, lingvistikos, Debesijos kompiuterijos ir interneto API.

Nuo ankstyvo 2010s, naujas dirbtinis intelektas technologija, giliai neuronų tinklai (taip pat žinomas kaip gilus mokymasis), leido kalbos atpažinimo technologiją pasiekti kokybės lygį, kuris leido Microsoft Translator komanda sujungti kalbėjimo atpažinimo su savo pagrindinę teksto vertimo technologiją, kad paleistumėte naują kalbėjimo vertimo technologiją.

Istoriškai, pagrindinis mašina mokymosi metodas, naudojamas pramonėje buvo statistinis mašininio vertimo (SMT). SMT naudoja išplėstinę statistinę analizę, kad galėtų įvertinti geriausius įmanomus žodžio vertimus, atsižvelgiant į kelių žodžių kontekstą. Visi pagrindiniai vertimo paslaugų teikėjai, įskaitant "Microsoft", buvo naudojami SMT nuo 2000-ų vidurio.

Iš neuronowe mašininio vertimo (NMT) atsiradimas sukėlė radikaliai pakeisti vertimo technologija, todėl daug aukštesnės kokybės vertimų. Ši vertimo technologija pradėjo diegti vartotojams ir kūrėjams pastaroji dalis 2016.

Abi SMT ir NMT vertimo technologijos turi du bendrus elementus:

  1. Abi reikalauja daug iš anksto žmogaus išversto turinio (iki milijonus išverstų sakinių) mokyti sistemas.
  2. Nei dvikalbiai žodynai, versti žodžius pagal potencialių vertimų sąrašą, bet versti remiantis žodžio, kuris naudojamas sakinyje kontekste.

Kas yra vertėjas?

Vertimo raštu ir kalbos paslaugos, kurios yra Kognityvinės paslaugos rinkinys API, yra mašininio vertimo paslaugos iš "Microsoft".

Teksto vertimas

Vertėjas "Microsoft" grupėse naudojamas nuo 2007 m., o klientams – kaip API nuo 2011 m. Vertėjas plačiai naudojamas "Microsoft". Jis įtrauktas į produktų lokalizavimo, palaikymo ir internetinio bendravimo komandas. Ta pati paslauga taip pat nemokamai prieinama iš pažįstamų "Microsoft" produktų, pvz., "Bing"Cortana"Microsoft Edge ‟OfficeSharepointSkypeir Gija.

Vertėjas gali būti naudojamas žiniatinklio ar kliento programose bet kurioje aparatūros platformoje ir su bet kuria operacine sistema kalbos vertimui ir kitoms su kalba susijusioms operacijoms, pvz., kalbos aptikimui, tekstui į kalbą ar žodynui, atlikti.

Naudojant pramonės standarto REST technologiją, kūrėjas siunčia šaltinio tekstą (arba garso įrašo vertimui kalbą) į tarnybą su parametru, nurodančia vertimo kalbą, ir tarnyba siunčia atgal išverstą tekstą klientui arba žiniatinklio programai naudoti.

Vertėjo paslauga yra "Azure" paslauga, kurios ištekliai nuomojami "Microsoft" duomenų centruose ir kuriai priklauso sauga, mastelio keitimas, patikimumas ir be sustojimo pasiekiamumas, kurį taip pat gauna kitos "Microsoft" debesies paslaugos.

Kalbos vertimas

Vertėjo kalbos vertimo technologija buvo pradėta naudoti 2014 m. pabaigoje, pradedant "Skype" vertėju, ir yra prieinama kaip atvira API klientams nuo 2016 m. pradžios. Jis integruotas į "Microsoft Translator" tiesioginę funkciją, "Skype", "Skype" susitikimų transliaciją ir "Microsoft Translator" programas, skirtas "Android" ir "iOS".

Kalbėjimo vertimas dabar pasiekiamas naudojant "Microsoft" kalbą, iki galo tinkinamas kalbėjimo atpažinimo, kalbėjimo vertimo ir kalbos sintezės (teksto į kalbą) paslaugas.

Kaip veikia teksto vertimas?

Yra dvi pagrindinės technologijos naudojamos teksto vertimas: palikimas vienas, statistikos mašininio vertimo (SMT), ir naujesnės kartos vienas, neuronowe Machine Translation (NMT).

Statistinis mašininio vertimo

Vertėjo įgyvendinimas Statistinis mašininis vertimas (SMT) yra pastatytas daugiau nei dešimtmetį natūralios kalbos tyrimų "Microsoft". Užuot rašę rankų darbo taisykles, kad būtų galima išversti tarp kalbų, šiuolaikinės vertimo sistemos kreipiasi į vertimą kaip į problemą, susijusią su teksto transformacijos tarp kalbų iš esamų žmogaus vertimų problema ir naujausiomis taikomosios statistikos ir mašininio mokymosi pažanga.

Vadinamasis "lygiagrečiai corpora" veikia kaip modernus Rosetta Stone masyvi proporcijas, teikiant žodį, frazę, ir idiomatinius vertimus kontekste daug kalbų porų ir domenų. Statistinio modeliavimo metodai ir efektyvūs algoritmai padeda kompiuteriui spręsti iššifravimo problemą (nustatyti korespondenciją tarp šaltinio ir tikslinės kalbos mokymo duomenyse) ir dekodavimo (rasti geriausią naujo įvesties sakinio vertimą). Vertėjas sujungia statistinių metodų galią su kalbine informacija, kad sukurtų modelius, kurie geriau apibendrintų ir leistų suprasti vertimus.

Dėl šio požiūrio, kuris nepriklauso nuo žodynų ar gramatinių taisyklių, jis pateikia geriausius frazių vertimus, kai jis gali naudoti kontekstą aplink duotą žodį ir bando atlikti vieno žodžio vertimus. Vieno žodžio vertimams dvikalbis žodynas buvo sukurtas ir pasiekiamas per www.Bing.com/Translator.

Neuronowe mašininis vertimas

Svarbu nuolat tobulinti vertimą. Tačiau nuo 2010 m. vidurio našumo patobulinimai buvo plynaukštėje su SMT technologija. Panaudodamas "Microsoft" AI superkompiuterio, ypač "Microsoft" kognityvinio įrankių rinkinio, mastą ir galią, vertėjas dabar siūlo neuroninį tinklą (LSTM), pagrįstą vertimu, kuris suteikia naują dešimtmetį vertimo kokybės gerinimo.

Šie neuroninio tinklo modeliai yra prieinami visoms kalbos kalboms per kalbos paslaugą "Azure" ir per teksto API naudojant "generalnn" kategorijos ID.

Neuronowe tinklo vertimai iš esmės skiriasi tuo, kaip jie atliekami, palyginti su tradiciniais SMT tie.

Ši animacija vaizduoja įvairių žingsnių nervinio tinklo vertimai pereiti į išversti sakinį. Dėl šio požiūrio, vertimas bus atsižvelgiama į kontekstą visą sakinį, palyginti tik su keliais žodžiais stumdomas langą, kad SMT technologija naudoja ir gamina daugiau skysčių ir žmogaus išverstų ieškote vertimai.

Remiantis neuroninio tinklo mokymu, kiekvienas žodis yra koduojamas palei 500-matmenys Vektorius (a), kuris atstovauja savo unikalias charakteristikas per tam tikrą kalbų porą (pvz., anglų ir kinų). Remiantis kalbų porų, naudojamų mokymo, neuroninis tinklas bus savarankiškai apibrėžti, ką šie matmenys turėtų būti. Jie gali koduoti paprastas sąvokas, tokias kaip Lytis (Moteriška, Vyriška, neutrali), mandagumo lygis (Slengas, atsitiktinis, parašytas, formalus ir tt), žodžio tipas (veiksmažodis, daiktavardis ir kt.), bet ir kitos neakivaizdžios charakteristikos, gautos iš mokymo duomenų.

Žingsniai nervinio tinklo vertimai eiti per yra šie:

  1. Kiekvienas žodis, arba tiksliau, 500-dimensija vektorius, atstovaujančių ji eina per pirmąjį sluoksnį "neuronai", kad bus užkoduoti jį 1000-dimensija Vektorius (b) atstovaujančių žodį, atsižvelgiant į kitų žodžių sakinys kontekste.
  2. Kai visi žodžiai buvo užkoduoti vieną kartą į šiuos 1000-dimensija vektorius, procesas kartojamas kelis kartus, kiekvienas sluoksnis leidžia geriau koreguojamosios šio 1000-dimensija atstovavimo žodžio per visą sakinį kontekste (priešingai nei SMT technologija, kuri gali būti atsižvelgiama tik į 3-5 žodžių langą)
  3. Tada galutinė išvesties matrica naudojama dėmesio sluoksnyje (t. y. programinės įrangos algoritme), kuris naudos tiek šią galutinę išvesties matricą, tiek anksčiau išverstų žodžių išvestį, kad apibrėžtų, kuris žodis iš šaltinio sakinio turi būti išverstas. Ji taip pat naudoti šiuos skaičiavimus potencialiai lašas nereikalingų žodžių tikslinės kalbos.
  4. Dekoderio (vertimo) sluoksnis verčia pasirinktą žodį (arba konkrečiau – 1000 dimensijų vektorius, reiškantis šį žodį viso sakinio kontekste) savo tinkamiausios tikslinės kalbos ekvivalentu. Šio paskutinio sluoksnio produkcija (c) tada šeriami atgal į dėmesio sluoksnis apskaičiuoti, kuris kitą žodį iš šaltinio sakinys turėtų būti išverstas.

Animacijoje pavaizduotą pavyzdį, kontekstą suvoks 1000-dimensijos modelis "į"užkoduoja, kad daiktavardis (House) yra moteriškas žodis prancūziškai (La Maison). Tai leis atitinkamai išversti "į"būti"La", o ne"Le"(vienaskaitos, vyriškos lyties) arba"Les"(daugiskaita), kai jis pasiekia dekoderio (vertimo) sluoksnį.

Dėmesio algoritmas taip pat apskaičiuoja, remiantis žodis (-ai) anksčiau išversta (šiuo atveju "į"), kad kitas žodis, kuris turi būti išverstas, turėtų būti tema ("House"), o ne būdvardis ("Mėlyna"). Tai galima pasiekti, nes sistema išmoko, kad anglų ir prancūzų pakeisti šių žodžių tvarka sakiniai. Ji taip pat būtų apskaičiavus, kad būdvardis būtų "Didelis"vietoj spalvos, kad ji neturėtų apversti juos ("didelis namas"= >"La Grande Maison").

Dėl šio požiūrio, galutinė produkcija, daugeliu atvejų, daugiau laisvai ir arčiau žmogaus vertimo nei SMT pagrįstas vertimas galėtų kada nors buvo.

Kaip veikia kalbos vertimas?

Vertėjas taip pat gali versti kalbą. Ši technologija yra veikiami Vertėlive funkcija (http://translate.it), vertėjas programos, "Skype" vertėjas ir taip pat iš pradžių prieinama tik per "Skype" vertėjas funkciją ir "Microsoft Translator" Apps "iOS" ir "Android", ši funkcija dabar yra prieinama kūrėjams su naujausia versija atviros REST-based API galima Azure portale.

Nors tai gali atrodyti kaip tiesiai į priekį procesas iš pirmo žvilgsnio sukurti kalbos vertimo technologiją iš esamų technologijų plytos, ji reikalauja daug daugiau darbo, nei tiesiog kaiščiais esamą "tradicinis" žmogaus prie kompiuterio kalbos atpažinimo variklį prie esamo teksto vertimo.

Norint tinkamai išversti "šaltinio" kalbą iš vienos kalbos į kitą "tikslinę" kalbą, sistema pereina keturių etapų procesą.

  1. Kalbėjimo atpažinimas, garso konvertavimas į tekstą
  2. TrueText: Microsoft technologija, kuri normalizuoja tekstą, kad jis labiau tinka vertimo
  3. Vertimas per teksto vertimo variklio aukščiau aprašytą, bet vertimo modelių, specialiai sukurtų realiame gyvenime kalbėjo pokalbiai
  4. Tekstas į kalbą, jei reikia, gaminti išverstą garsą.

Automatinis kalbėjimo atpažinimas (ASR)
Automatinis kalbėjimo atpažinimas (ASR) atliekamas naudojant neuroninio tinklo (NN) sistemą, išmokytą analizuojant tūkstančius valandų gaunamo garso įrašo kalbos. Šis modelis yra apmokyti žmogaus į žmogaus sąveiką, o ne iš žmogaus į mašiną komandas, gaminančių kalbos atpažinimo, kad yra optimizuotas normalus pokalbius. Norint tai pasiekti, reikia daug daugiau duomenų, taip pat didesnis DNN nei tradicinių žmogaus į mašiną ASRs.

Sužinokite daugiau apie "Microsoft" kalbos ir teksto paslaugos.

TekstasJeiTiesa
Kaip žmonės bičiulį su kitais žmonėmis, mes kalbame ne taip puikiai, aiškiai ar tvarkingai, kaip mes dažnai manome, kad mes darome. Su TrueText technologiją, pažodinis tekstas yra transformuojama į labiau atspindi vartotojo ketinimų pašalinant kalbos disfluencies (užpildo žodžiai), pavyzdžiui, "UM" s "Ah" s "ir" s ", kaip" s, stutters ir pakartojimų. Tekstas taip pat yra labiau įskaitomas ir išverčiamas pridedant sakinio pertraukas, tinkamą skyrybos ženklą ir didžiųjų raidžių rašybą. Norėdami pasiekti šiuos rezultatus, mes panaudojame dešimtmečius darbo kalbų technologijas, mes sukūrėme iš vertėjas sukurti TrueText. Toliau pateiktoje diagramoje, naudojant realaus gyvenimo pavyzdį, pavaizduota įvairių transformacija TrueText veikia normalizuoti šį pažodinis tekstas.

 

Vertimas
Tada tekstas išverčiamas į bet kurią iš kalbos ir dialektai remia Vertėjas.

Vertimai naudojant kalbos vertimo API (kaip kūrėjas) arba kalbos vertimo programa arba paslauga, yra powered su naujausia neuroninių tinklo pagrįstas vertimai į visas kalbos įvesties palaikomų kalbų (žr. čia visą sąrašą). Šie modeliai taip pat buvo pastatytas plėsti dabartinį, daugiausia parašyta teksto apmokyti vertimo modelius, daugiau kalbėjo teksto corpora sukurti geresnį modelį kalbėjo pokalbį tipų vertimai. Šiuos modelius taip pat galima "kalbos" standartinės kategorijos teksto vertimo API.

Dėl bet kokiomis kalbomis nepalaikoma nervinio vertimo, tradicinis SMT vertimas atliekamas.

Tekstas į kalbą
Jei tikslinė kalba yra viena iš 18 palaikomų teksto į kalbą Kalbų, ir naudojimo atveju reikia garso išvestį, tekstas tada konvertuojamas į kalbos išvesties naudojant kalbos sintezę. Šis etapas praleidžiamas kalbos konvertavimo į tekstą scenarijuose.

Sužinokite daugiau apie "Microsoft" tekstas į kalbėjimo tarnybas.

Mokslinių tyrimų


Ši paslauga yra dalis "Azure" dirbtinio intelekto paslaugos