Nuskaitytų PDF dokumentų vertimas su dokumento vertimu
Šiandien Dokumentų vertimas "Microsoft Azure" kognityvinės tarnybos "Translator" funkcija suteikia galimybę išversti PDF dokumentus, kuriuose yra nuskaityto vaizdo turinio, todėl klientams prieš vertimą nereikia iš anksto juos apdoroti per OCR variklį.
Dokumentų vertimas buvo visuotinai prieinamas praėjusiais metais, gegužės 25, 2021, leidžiant klientams išversti visus dokumentus ir dokumentų paketus į daugiau nei 110 kalbų ir dialektų išsaugant pradinio failo maketą ir formatavimą. Dokumentų vertimas palaiko įvairius failų tipus, įskaitant "Word", "PowerPoint" ir PDF, o klientai gali naudoti iš anksto sukurtus arba pasirinktinius mašininio vertimo modelius. Dokumentų vertimas yra paruoštas įmonei naudojant "Azure Active Directory" autentifikavimą, užtikrinantį saugią prieigą tarp paslaugos ir saugyklos per valdomą tapatybę.
PDF rinkmenų vertimas su nuskaitytu vaizdo turiniu yra labai pageidaujama dokumentų vertimo klientų funkcija. Klientams sunku atskirti PDF dokumentus, kuriuose yra įprastas tekstas arba nuskaitytas vaizdo turinys automatizavimo būdu. Tai sukuria darbo eigos problemas, nes klientai pirmiausia turi nukreipti PDF dokumentus su nuskaitytu vaizdo turiniu į OCR variklį prieš siųsdami juos į dokumentų vertimą.
Dokumentų vertimo tarnybos dabar turi žvalgybinę informaciją
- nustatyti, ar PDF dokumente yra nuskaityto vaizdo turinio, ar ne,
- nukreipti PDF rinkmenas, kuriose yra nuskaityto vaizdo turinio, į OCR variklį viduje, kad būtų galima išgauti tekstą,
- rekonstruoti išverstą turinį kaip įprastą tekstą PDF, išlaikant originalų išdėstymą ir struktūrą.
Šrifto formatavimas, pvz., paryškintasis, kursyvas, pabraukimas, paryškinimas ir kt., nėra išsaugotas nuskaitytam PDF turiniui, nes OCR technologija šiuo metu jų neužfiksuoja. Tačiau šrifto formatavimas išsaugomas verčiant įprastus tekstinius PDF dokumentus.
Dokumentų vertimas šiuo metu palaiko PDF dokumentus, kuriuose yra nuskaityto vaizdo turinio Nuo 68 kalbų iki 87 tikslinių kalbų. Parama papildomoms šaltinio ir tikslinėms kalboms bus pridėta tinkamu laiku.
Dabar klientams lengviau siųsti visus PDF dokumentus tiesiogiai dokumentų vertimui ir leisti jam nuspręsti, kada ir kaip efektyviai naudoti OCR variklį.
Klientams, kurie jau naudoja dokumento vertimą, norint naudoti šią naują funkciją, kodo keisti nereikia. PDF dokumentai su nuskaitytu turiniu gali būti pateikti vertimui, kaip ir bet kuris kitas palaikomas dokumentų formatas.
Mes taip pat džiaugiamės galėdami pranešti, kad dokumento vertimas suteikia palaikymą nuskaitytam PDF dokumento turiniui be jokių papildomų mokesčių klientams. Dokumentų vertimui per "Azure" galimi du kainodaros planai - "Pay-as-you-go" planas ir D3 apimties nuolaidos planas, skirtas didesniems dokumentų vertimo tomams. Išsamią informaciją apie kainas galima rasti aka.ms/TranslatorPricing.
Sužinokite, kaip pradėti nuo dokumento vertimo aka.ms/DocumentTranslationDocs.
Siųskite atsiliepimą mtfb@microsoft.com.