Skenētu PDF dokumentu tulkošana, izmantojot dokumentu tulkošanu
Mūsdienās Dokumentu tulkošana Microsoft Azure Cognitive Service Tulkotāja līdzeklis pievieno iespēju tulkot PDF dokumentus, kas satur skenētu attēla saturu, novēršot nepieciešamību klientiem tos pirms tulkošanas iepriekš apstrādāt, izmantojot OCR programmu.
Dokumentu tulkošana kopumā bija pieejama pagājušajā gadā, 2021. gada 25. maijā, ļaujot klientiem tulkot veselus dokumentus un dokumentu partijas vairāk nekā 110 valodas un dialekti vienlaikus saglabājot sākotnējā faila izkārtojumu un formatējumu. Dokumentu tulkošana atbalsta dažādus failu tipus, tostarp Word, PowerPoint un PDF, un klienti var izmantot iepriekš izveidotus vai pielāgotus mašīntulkošanas modeļus. Dokumentu tulkošana ir gatava uzņēmumam, izmantojot Azure Active Directory autentifikāciju, nodrošinot drošu piekļuvi starp pakalpojumu un krātuvi, izmantojot pārvaldīto identitāti.
PDF failu tulkošana ar skenētu attēla saturu ir ļoti pieprasīta funkcija no dokumentu tulkošanas klientiem. Klientiem ir grūti nošķirt PDF dokumentus, kuriem ir regulārs teksts vai skenēts attēla saturs, izmantojot automatizāciju. Tas rada darbplūsmas problēmas, jo klientiem pdf dokumenti ar skenētu attēla saturu vispirms ir jāmaršrutē uz OCR programmu, pirms tie tiek nosūtīti uz dokumentu tulkošanu.
Dokumentu tulkošanas pakalpojumiem tagad ir izlūkdatu
- lai noteiktu, vai PDF dokumentā ir vai nav skenēts attēla saturs,
- lai iekšēji novirzītu PDF failus, kas satur skenētu attēla saturu, uz OCR dzinēju teksta izvilkšanai,
- rekonstruēt tulkoto saturu kā parastu teksta PDF failu, saglabājot sākotnējo izkārtojumu un struktūru.
Fontu formatējums, piemēram, treknraksts, slīpraksts, pasvītrojums, izcēlumi utt., Netiek saglabāts skenētam PDF saturam, jo OCR tehnoloģija tos pašlaik netver. Tomēr fontu formatējums tiek saglabāts, tulkojot parastos teksta PDF dokumentus.
Dokumentu tulkošana pašlaik atbalsta PDF dokumentus, kas satur skenētu attēla saturu no 68 avota valodām 87 mērķa valodās. Pienācīgā laikā tiks pievienots atbalsts papildu avota un mērķa valodām.
Tagad klientiem ir vieglāk nosūtīt visus PDF dokumentus tieši uz dokumentu tulkošanu un ļaut izlemt, kad un kā efektīvi izmantot OCR dzinēju.
Klientiem, kuri jau izmanto dokumentu tulkošanu, nav nepieciešamas koda izmaiņas, lai varētu izmantot šo jauno līdzekli. PDF dokumentus ar skenētu saturu var iesniegt tulkošanai tāpat kā jebkurus citus atbalstītus dokumentu formātus.
Ar prieku paziņojam, ka Dokumenta tulkojums pievieno atbalstu skenētam PDF dokumenta saturam bez papildu maksas klientiem. Dokumentu tulkošanai, izmantojot Azure, ir pieejami divi cenu plāni — paaudžu solidaritātes plāns un D3 apjoma atlaižu plāns lielākiem dokumentu tulkošanas apjomiem. Detalizētu informāciju par cenām var atrast aka.ms/TranslatorPricing.
Uzziniet, kā sākt dokumentu tulkošanu aka.ms/DocumentTranslationDocs.
Nosūtiet savas atsauksmes uz mtfb@microsoft.com.