Siirry päähistoria
Kääntäjä
Microsoft Translatorin kone käännös palvelu on kääntänyt tämän sivun automaattisesti. Opi lisää

Konekääntäminen

Mikä on kone kääntäminen?

Kone käännös järjestelmät ovat sovelluksia tai verkko palveluja, jotka käyttävät kone oppimisen tekniikoita suurten teksti määrien kääntämiseen tuetuista kielistä. Palvelu kääntää "lähde"-tekstin kielestä toiselle "kohde" kielelle.

Vaikka kone käännös tekniikan ja sen käyttö liittymien käsitteet ovat suhteellisen yksinkertaisia, sen taustalla olevat tieteet ja teknologiat ovat erittäin monimutkaisia ja tuovat yhteen useita johtavia teknologioita, erityisesti syvällistä oppimista ( tekoäly), Big Data, kieli tiede, Cloud Computing, ja Web API.

Koska alussa 2010s, uusi tekoäly teknologia, syvä hermo verkot (alias syvä oppiminen), on mahdollistanut teknologian puheen tunnistuksen saavuttaa laatu taso, joka saa Microsoft Kääntäjä joukkue yhdistää puheen tunnistuksen kanssa ydin tekstin käännös teknologiaa uuden puheen käännös tekniikan käynnistämiseen.

Historiallisesti ensisijainen kone oppimisen tekniikkaa käytetään alalla oli tilastollinen Machine translation (SMT). SMT käyttää kehittyneitä tilastollinen analyysi arvioida paras mahdollinen käännöksiä sana, koska yhteydessä muutaman sanan. SMT on käytetty vuodesta 2000-luvun alusta kaikkien tärkeimpien käännös palvelujen tarjoajat, mukaan lukien Microsoft.

Neural Machine translation (NMT)-käännös aiheutti radikaalin kääntämisen käännös tekniikassa, mikä johtaa paljon laadukkaampiin käännöksiin. Tämä käännös tekniikka aloitti käyttöönoton käyttäjille ja kehittäjille 2016 loppu osan.

Sekä SMT-että NMT-käännös tekniikoilla on kaksi yhteistä tekijää:

  1. Molemmat vaativat suuria määriä esiinhimillistä käännettyä sisältöä (jopa miljoonia käännettyjä lauseita) kouluttaa järjestelmiä.
  2. Kumpikaan toimii kaksikielinen sana kirjoja, kääntää sanat perustuvat luettelon mahdollisista käännöksistä, mutta kääntää perustuu yhteydessä sana, jota käytetään lause.

Mikä on Kääntäjä?

Kääntäjä- ja puhepalvelut, osa Kognitiiviset palvelut API-kokoelma on Microsoftin kone käännös palvelu.

Tekstin kääntäminen

Microsoft-ryhmät ovat käyttäneet kääntäjää vuodesta 2007, ja se on ollut saatavilla API-liittymänä asiakkaille vuodesta 2011 lähtien. Kääntäjää käytetään microsoftissa laajasti. Se on sisällytetty tuotteiden lokalisointi-, tuki- ja online-viestintäryhmiin. Tämä sama palvelu on saatavilla myös ilman lisäkustannuksia tutuista Microsoftin tuotteista, kuten BingCortanaMikroskooppi hioaOfficeSharepointSkypeja Yammer.

Kääntäjää voidaan käyttää verkko- tai asiakassovelluksissa millä tahansa laitteistoalustalla ja millä tahansa käyttöjärjestelmällä kielen kääntämiseen ja muihin kieliin liittyviin toimintoihin, kuten kielentunnistukseen, tekstistä puheeseen tai sanakirjasta.

Hyödyntämällä alan standardia REST-teknologiaa kehittäjä lähettää palveluun lähde tekstin (tai äänen puhe käännöstä varten), jonka parametri ilmaisee kohde kielen, ja palvelu lähettää käännetyn tekstin asiakkaalle tai verkko sovellukselle.

Translator-palvelu on Azure-palvelu, jota isännöidään Microsoftin palvelinkeskuksissa ja joka hyötyy muiden Microsoftin pilvipalvelujen tietoturvasta, skaalattavuudesta, luotettavuudesta ja nonstop-saatavuudesta.

Puheen kääntäminen

Kääntäjän puheenkääntämistekniikka lanseerattiin loppuvuodesta 2014 Alkaen Skype Translatorista, ja se on saatavilla avoimena API:na asiakkaille alkuvuodesta 2016 lähtien. Se on integroitu Microsoft Translator live -ominaisuuteen, Skypeen, Skype-kokouslähetykseen sekä Microsoft Translator -sovelluksiin Androidille ja iOS:lle.

Puheen kääntäminen on nyt saatavilla Microsoft Speech, end-to-end joukko täysin muokattavissa Palvelut puheen tunnistuksen, puheen kääntäminen, ja puhe synteesi (Text-to-Speech).

Miten tekstin kääntäminen toimii?

On olemassa kaksi keskeistä teknologiaa käytetään tekstin kääntäminen: perintö yksi, tilastollinen Machine translation (SMT), ja uudempi suku polvi yksi, Neural Machine translation (NMT).

Tilastollinen kone käännös

Käännösten kääntäminen (SMT) on rakennettu yli vuosikymmenen luonnollisen kielen tutkimukselle Microsoftilla. Sen sijaan, että nykyaikaisia käännösjärjestelmiä kirjoitetaan kielten kääntämiseen käsin tehdyistä säännöistä, ne lähestyvät kääntämistä ongelmana, joka on oppimisen ongelma kielten välillä olemassa olevista ihmiskäännöksistä ja viimeaikaisten edistysaskelten hyödyntäminen soveltavan tilaston ja koneoppimisen viimeaikaisessa edistymisessä.

Niin kutsutut "rinnakkaiskorpraali" toimivat modernina Rosettan kivenä valtavissa mittasuhteissa, tarjoten sana-, lause- ja idiomaattisia käännöksiä monien kieliparien ja verkkotunnusten yhteydessä. Tilastolliset mallinnustekniikat ja tehokkaat algoritmit auttavat tietokonetta puuttumaan ongelman selvittämiseen (lähde- ja kohdekielen välisen vastaavuuden havaitseminen koulutustiedoissa) ja dekoodauksen purkamiseen (uuden syöttölauseen parhaan käännöksen löytäminen). Kääntäjä yhdistää tilastollisten menetelmien voiman kielelliseen tietoon tuottaakseen malleja, jotka yleistyvät paremmin ja johtavat ymmärrettävämpiin käännöksiin.

Koska tämä lähestymis tapa, joka ei perustu sana kirjoja tai kieliopillisia sääntöjä, se tarjoaa parhaat käännökset lauseita, joissa se voi käyttää yhteydessä noin tietyn sanan vs. yrittää tehdä yhden sanan käännöksiä. Yksittäisiä sanoja käännökset, kaksikielinen sana kirja on kehitetty ja pääsee läpi www.Bing.com/Translator.

Neural kone käännös

Jatkuvat parannukset kääntämiseen ovat tärkeitä. Suorituskyvyn parannukset ovat kuitenkin tasaantuneet SMT-teknologian kanssa 2010-luvun puolivälistä lähtien. Hyödyntämällä laajuutta ja voimaa Microsoftin AI supertietokone, erityisesti Microsoft Cognitive Toolkit, Kääntäjä tarjoaa nyt hermoverkko (LSTM) perustuva käännös, joka mahdollistaa uuden vuosi kymmenen käännöksen laadun parantamiseen.

Nämä neuroverkkomallit ovat käytettävissä kaikilla puhekielillä Azuren puhepalvelun kautta ja teksti-API:n kautta käyttämällä "generalnn"-luokkatunnusta.

Neuraalilaskennan verkko käännökset pohjimmiltaan eroavat siitä, miten ne suoritetaan verrattuna perinteisiin SMT niistä.

Seuraavat animaatio kuvaa eri vaiheissa neuraalilaskennan verkko käännökset läpi kääntää lause. Tämän vuoksi lähestymis tapa, käännös otetaan yhteydessä koko lause, verrattuna vain muutaman sanan liukuva ikkuna että SMT tekniikka käyttää ja tuottaa enemmän nestettä ja ihmisen käännetty näköinen käännöksiä.

Perustuu neuraalilaskennan-verkko koulutus, jokainen sana on koodattu pitkin 500-mitat vektori (a) edustavat sen ainutlaatuisia ominaisuuksia tietyllä kielellä pari (esim. Englanti ja Kiina). Perustuu kieli paria käytetään koulutukseen, neuraalilaskennan verkosto itse määritellä, mitä nämä mitat pitäisi olla. He voisivat koodata yksinkertaisia käsitteitä, kuten suku puoli (naisellinen, maskuliininen, neutraali), kohteliaisuutta tasolla (slangi, rento, kirjallinen, muodollinen, jne.), sanan tyyppi (verbi, substantiivi, jne.), mutta myös muita ei-ilme isiä ominaisuuksia johdettu koulutus tiedot.

Vaiheet neuraalilaskennan verkko käännöksiä läpi ovat seuraavat:

  1. Jokainen sana, tai tarkemmin sanottuna 500-ulottuvuus vektori edustaa sitä, menee läpi ensimmäinen kerros "neuronien", joka koodaa sen 1000-ulottuvuus vektori (b) edustaa sanaa yhteydessä muiden sanojen lause.
  2. Kun kaikki sanat on koodattu kerran näihin 1000-ulottuvuus vektorit, prosessi toistetaan useita kertoja, jokainen kerros mahdollistaa paremman hienosäätöä tämän 1000-ulottuvuus edustus sanan puitteissa koko lause (toisin SMT teknologiaa, joka voi vain ottaa huomioon 3 että 5 sanaa ikkuna)
  3. Lopullinen tuotos matriisi sitten käyttää huomiota kerros (eli ohjelmisto algoritmi), joka käyttää sekä tämän lopullisen tuotannon matriisi ja tuotos aiemmin käännetty sanoja määritellä, mikä sana, lähde lauseesta, olisi käännettävä seuraavaksi. Se myös käyttää näitä laskelmia mahdollisesti pudottaa tarpeettomia sanoja kohde kielellä.
  4. Dekooderi (käännös) kerros, kääntää valitun sanan (tai tarkemmin sanottuna 1000-ulottuvuus vektori edustaa tätä sanaa osana koko lause) sen sopivin kohde kieli vastaava. Tuotos tämän viimeisen kerroksen (c) on sitten syötetään takaisin huomio kerroksen laskea, joka seuraavan sanan lähde lause olisi käännettävä.

Esimerkissä kuvattu animaatio, konteksti-Aware 1000-ulottuvuus malli "Nniiden"koodaa, että substantiivi (House) on naisellinen sana ranskaksi (La Maison). Tämä mahdollistaa asianmukaisen käännöksen "Nniiden"olla"La"eikä"Le"(yksikkö, uros) tai"Les"(monikko), kun se saapuu dekooderi (käännös) kerros.

Huomio algoritmi myös laskea, perustuu sana (t) aiemmin käännetty (tässä tapa uksessa "Nniiden"), että seuraava käännettävän sanan pitäisi olla aihe ("House") eikä adjektiivi ("Sininen"). In voi saavuttaa tämän, koska järjestelmä tietää, että Englanti ja Ranska kääntää järjestystä näiden sanojen lauseissa. Se olisi myös laskenut, että jos adjektiivi olisi "Iso"sen sijaan, että väri, että se ei käännä niitä ("iso talo"= >"La Grande Maison").

Tämän lähestymis tavan ansiosta loppu tulos on useimmissa tapa uksissa sujuva ja lähempänä ihmisen käännöstä kuin SMT-pohjainen käännös olisi voinut koskaan olla.

Miten puheen kääntäminen toimii?

Kääntäjä pystyy myös kääntämään puhetta. Tämä tekniikka näkyy Kääntäjä live ominaisuus (http://translate.it), kääntäjä apps, Skype kääntäjä ja on myös alun perin saatavilla vain Skype Kääntäjä ominaisuus ja Microsoft Kääntäjä apps iOS ja Android, Tämä toiminnallisuus on nyt saatavilla kehittäjille uusimman version avoimen REST-pohjainen API käytettävissä Azure-portaalissa.

Vaikka se voi tuntua suoraan eteenpäin prosessi ensi silmäyksellä rakentaa puheen käännös teknologiaa nykyisten teknologia tiilet, se vaati paljon enemmän työtä kuin vain kytkemällä olemassa "perinteinen" ihmisen ja koneen puheen tunnistus nykyisen tekstin käännöksen yksi.

Oikein kääntää "lähde" puhetta kielestä toiseen "tavoite" kieli, järjestelmä menee läpi nelivaiheinen prosessi.

  1. Puheen tunnistus, muuntaa äänen tekstiksi
  2. TrueText: Microsoft-tekniikka, joka normalisoi tekstin, jotta se olisi sopivampi käännettäväksi
  3. Kääntäminen läpi tekstin käännös moottori kuvattu edellä, mutta käännös malleja erityisesti kehitetty tosielämässä puhuttu keskusteluja
  4. Text-to-Speech, tarvittaessa, tuottaa käännetyn äänen.

Automaattinen puheen tunnistus (ASR)
Automaattinen puheen tunnistus (ASR) suoritetaan käyttäen neuraalilaskennan verkko (NN) järjestelmä koulutettu analysoida tuhansia tunteja saapuvan äänen puhe. Tämä malli on koulutettu ihmisen ja ihmisen välistä vuoro vaikutusta eikä ihmisen ja koneen komentoja, tuottaa puheen tunnistus, joka on optimoitu normaaliin keskusteluja. Tämän saavuttamiseksi tarvitaan paljon enemmän tietoja sekä suurempi DNN kuin perinteiset ihmisen ja koneen ASRs.

Lisätietoja Microsoftin puhe teksti palveluihin.

TosiTeksti
Koska ihmiset keskustellessamme muiden ihmisten kanssa, emme puhu niin täydellisesti, selvästi tai siististi kuin me usein ajattelemme teemme. TrueText-tekniikan avulla kirjaimellinen teksti muuttuu vastaamaan paremmin käyttäjän tarkoitusta poistamalla puhe häiriö (täyte aine sanat), kuten "Umm" s, "Ah" s, "ja" s, "Like" s, toistu sujuvasti ja toistoja. Teksti on myös tehty luettavampaa ja käännettäväksi lisäämällä lause taukoja, oikea väli merkit ja isojen kirjainten. Saavuttaaksemme nämä tulokset, käytimme vuosi kymmeniä työtä kieli teknologiaa, olemme kehittäneet Kääntäjä luoda TrueText. Seuraavassa kaaviossa esitetään tosielämän esimerkin kautta eri muunnos TrueText toimii normalisoimaan tämän kirjaimellisen tekstin.

 

Käännös
Teksti käännetään sitten mihin tahansa kielet ja murteet kääntäjän tukemana.

Käännökset käyttäen puheen käännös API (kuten kehittäjä) tai puheen käännös sovellus tai palvelu, on powered kanssa uusin neuraalilaskennan-verkko perustuu käännöksiä kaikille puhe-input Tuetut kielet (ks. Täällä täydellinen luettelo). Nämä mallit rakennettiin myös laajentamalla nykyinen, enimmäkseen kirjallisen tekstin koulutettu käännös malleja, enemmän puhuttu-teksti corpora rakentaa paremman mallin puhuttu keskustelun tyyppisiä käännöksiä. Nämä mallit ovat saatavilla myös "puhe" vakio luokka perinteisen tekstin käännös-API.

Kaikkien kielten ei tue neuraalilaskennan käännös, perinteinen SMT käännös suoritetaan.

Teksti puheeksi
Jos kohde kieli on yksi 18 tuetuista tekstistä puheeksi- Kielet, ja käyttö tapaus vaatii ääni lähdön, teksti muunnetaan puhe tulosksi puhe synteesiä käyttäen. Tämä vaihe jätetään pois puheesta tekstiksi-käännös skenaarioissa.

Lisätietoja Microsoftin teksti puhe palveluihin.

Tutkimus


Tämä palvelu on osa Azuren tekoälypalvelut