Dịch tài liệu PDF đã quét bằng bản dịch Tài liệu
Hôm nay, Dịch tài liệu Tính năng của Translator, một Dịch vụ nhận thức Microsoft Azure, bổ sung khả năng dịch các tài liệu PDF có chứa nội dung hình ảnh được quét, loại bỏ nhu cầu của khách hàng để xử lý trước chúng thông qua một công cụ OCR trước khi dịch.
Bản dịch tài liệu đã được thực hiện thường có sẵn vào năm ngoái, ngày 25 tháng 5 năm 2021, cho phép khách hàng dịch toàn bộ tài liệu và lô tài liệu thành nhiều hơn 110 ngôn ngữ và phương ngữ trong khi vẫn giữ nguyên bố cục và định dạng của tệp gốc. Dịch tài liệu hỗ trợ nhiều loại tệp khác nhau, bao gồm Word, PowerPoint và PDF và khách hàng có thể sử dụng các mô hình dịch máy được xây dựng sẵn hoặc tùy chỉnh. Bản dịch tài liệu đã sẵn sàng cho doanh nghiệp với xác thực Azure Active Directory, cung cấp quyền truy cập bảo mật giữa dịch vụ và lưu trữ thông qua Danh tính được quản lý.
Dịch pdf với nội dung hình ảnh được quét là một tính năng được yêu cầu cao từ khách hàng dịch tài liệu. Khách hàng cảm thấy khó phân tách các tài liệu PDF có văn bản thông thường hoặc nội dung hình ảnh được quét thông qua tự động hóa. Điều này tạo ra các vấn đề về quy trình làm việc vì khách hàng phải định tuyến tài liệu PDF với nội dung hình ảnh được quét trước tiên đến công cụ OCR trước khi gửi chúng đến bản dịch tài liệu.
Dịch vụ dịch thuật tài liệu hiện có trí thông minh
- để xác định xem tài liệu PDF có chứa nội dung hình ảnh được quét hay không,
- để định tuyến các tệp PDF có chứa nội dung hình ảnh được quét đến một công cụ OCR trong nội bộ để trích xuất văn bản,
- để xây dựng lại nội dung được dịch dưới dạng pdf văn bản thông thường trong khi vẫn giữ được bố cục và cấu trúc ban đầu.
Định dạng phông chữ như in đậm, nghiêng, gạch chân, điểm nổi bật, v.v. không được giữ lại cho nội dung PDF được quét vì công nghệ OCR hiện không chụp chúng. Tuy nhiên, định dạng phông chữ được bảo tồn trong khi dịch các tài liệu PDF văn bản thông thường.
Bản dịch tài liệu hiện hỗ trợ tài liệu PDF chứa nội dung hình ảnh được quét Từ 68 ngôn ngữ nguồn thành 87 ngôn ngữ mục tiêu. Hỗ trợ cho các ngôn ngữ nguồn và mục tiêu bổ sung sẽ được thêm vào trong thời gian tới.
Bây giờ khách hàng dễ dàng gửi tất cả các tài liệu PDF đến Bản dịch Tài liệu trực tiếp và để nó quyết định khi nào và làm thế nào để sử dụng công cụ OCR hiệu quả.
Đối với khách hàng đã sử dụng bản dịch Tài liệu, không cần thay đổi mã để có thể sử dụng tính năng mới này. Tài liệu PDF có nội dung được quét có thể được gửi để dịch như bất kỳ định dạng tài liệu được hỗ trợ nào khác.
Chúng tôi cũng vui mừng thông báo rằng bản dịch Tài liệu bổ sung hỗ trợ cho nội dung tài liệu PDF được quét mà không phải trả thêm phí cho khách hàng. Hai gói giá có sẵn để dịch tài liệu thông qua Azure - gói Pay-as-you-go và gói giảm giá khối lượng D3 cho khối lượng dịch tài liệu cao hơn. Chi tiết giá có thể được tìm thấy tại aka.ms/TranslatorPricing.
Tìm hiểu cách bắt đầu với bản dịch tài liệu tại aka.ms/DocumentTranslationDocs.
Gửi phản hồi của bạn đến mtfb@microsoft.com.