Nhóm dịch máy tại Microsoft Research
Nhóm dịch thuật của Microsoft Research (MSR-MT) là một trong những tổ chức nghiên cứu hàng đầu trong không gian dịch máy trong hơn 8 năm, và một số công việc cơ bản trong xử lý ngôn ngữ tự nhiên tại MSR bắt đầu từ 16 năm trước. Cách tiếp cận của nhóm để dịch máy tích hợp các tính năng ngôn ngữ với các thuật toán dịch máy thống kê nhà nước-of-the-Art. Tập trung của nhóm luôn được tự động thu thập kiến thức dịch từ song ngữ corpora, tức là dữ liệu Parallel bao gồm các câu ngôn ngữ nguồn gốc và các bản dịch tương Khoảng 3 năm trước đây, tập trung của nhóm chuyển từ một cách tiếp cận hoàn toàn dựa trên quy tắc cho nhiệm vụ này hướng tới một phương pháp tiếp cận lai bao gồm xử lý thống kê rộng rãi, cho phép khả năng mở rộng lớn hơn trên các tên miền và sang ngôn ngữ mới.
Công nghệ dịch máy của Microsoft lần đầu tiên được phát triển cho mục đích bản địa hóa trong nhà, để Cho phép tổ chức hỗ trợ khách hàng của chúng tôi để xuất bản các tài liệu hỗ trợ kỹ thuật với tần suất và bề rộng ngôn ngữ mà có rất tốn kém bằng cách sử dụng dịch của con người. Với tất cả các tài liệu trước đây của Microsoft đã dịch con người và phần mềm bản địa hóa theo ý của nó, nhóm MT đã có thể tự động đào tạo động cơ MT thống kê của nó để đạt được chất lượng khá tốt trong lĩnh vực kỹ thuật. Công nghệ này được mở rộng để hỗ trợ nhóm bản địa hoá Windows, bộ phận phát triển, MSDN và một số nhóm khác trong Microsoft. Nó cũng cho phép Microsoft tiếp cận được nhiều khách hàng hơn bao giờ hết có thể sử dụng bản dịch của con người một mình.
Sau khi tập trung vào nhu cầu dịch thuật của Microsoft, nhóm bắt đầu xây dựng một dịch vụ web có khả năng mở rộng cho phép nó cung cấp dịch vụ dịch thuật cho công chúng, như là một công cụ độc lập trên web, và như một tính năng trong các sản phẩm khác. Cho rằng công cụ Microsoft MT đã được đào tạo nhiều nhất về dữ liệu kỹ thuật, nó vẫn chưa được điều chỉnh để dịch văn bản trong các lĩnh vực chủ đề khác. Tuy nhiên, chúng tôi hy vọng sẽ tiếp tục cải thiện chất lượng và bề rộng của động cơ. Chúng tôi mong muốn chia sẻ sự phát triển của chúng tôi với bạn trong những tháng tới trên blog này.
– Heather