Um metal pode (não pode?): blog do convidado
Lee Schwartz é um linguista computacional na equipe do Microsoft Translator. Blog de hoje convidado é sobre como se perder em (máquina) tradução...
———————————————————————————–
Recentemente, um usuário pareceu chateado com a tradução que ele recebeu para uma pintura de metal pode. Não é de se admirar. Quando ele traduziu isso para o espanhol, ele conseguiu un metal pintura puede, o que significa uma pintura metálica é capaz de. E o que isso quer dizer? Mas, então, novamente, o que é "significado" para um sistema de tradução automática de qualquer maneira? Alguma coisa significa alguma coisa? Ou, é o computador apenas vendo palavras em combinação em um idioma e palavras correspondentes em outro idioma? E é supor que porque uma seqüência é usada no idioma de origem quando outro é usado no alvo, um é a tradução de outro? Mesmo se o programa de tradução automática está apenas vendo palavras em combinação, não teria visto a pintura pode antes e saber que o Cna Neste contexto é algum tipo de recipiente? Então, mais uma vez, você pode ter certeza de que o computador por trás do programa MT sabe alguma coisa sobre latas de tinta, ou viu essas duas palavras em combinação? Por que acha que teria? Mas, dando-lhe o benefício da dúvida, e assumindo que ele sabe tudo sobre latas de tinta, ou pelo menos viu a corda a pintura pode muito, como é suposto saber como traduzir uma pintura de metal pode? Talvez o computador tenha visto algo como O filme de metal em um lado da placa... pode ser obtido por... pulverização de uma pintura de metal ou....
Ah ha! Então, há realmente tintas metálicas. E, se houver tintas metálicas, por que não pode uma pintura de metal pode ser a resposta para uma lata de tinta metálica, não pode? Bem, não é apenas provável que quando você tem as palavras Pintar e Cna em sequência, que Cna Significa ser capaz de. Mas, novamente, não é apenas provável que Cna significa nada, mas ser capaz de. Acho que podemos dizer coisas e pensar coisas que não são apenas prováveis. Eu posso facilmente entender o que Uma tinta metálica pode, não é? Significa. O computador pode apenas pensar que eu inadvertidamente digitado Cna Duas vezes. Certamente, se ele aprende a partir de dados reais, digamos, a partir da Web, ele vai ver pode pode Muito. Talvez seja por isso que não vai traduzir Ele fez a lata pode Corretamente. Mas realmente, o que é inglês fazendo com tantos tipos de Latas qualquer maneira? Podemos até conseguir vermes, mas não abrimos essa agora.