Översätt skannade PDF-dokument med dokumentöversättning
Idag är Översättning av dokument Funktionen Translator, en Microsoft Azure Cognitive Service, ger möjlighet att översätta PDF-dokument som innehåller skannade bilder, vilket gör att kunderna inte längre behöver förbehandla dem genom en OCR-motor innan de översätts.
Dokumentöversättning blev allmänt tillgänglig förra året, den 25 maj 2021, vilket gör det möjligt för kunderna att översätta hela dokument och partier av dokument till mer än 110 språk och dialekter samtidigt som du behåller layouten och formateringen i den ursprungliga filen. Dokumentöversättning stöder en mängd olika filtyper, inklusive Word, PowerPoint och PDF, och kunderna kan använda antingen förbyggda eller anpassade maskinöversättningsmodeller. Dokumentöversättningen är företagsanpassad med Azure Active Directory-autentisering, vilket ger säker åtkomst mellan tjänsten och lagringen genom Managed Identity.
Översättning av PDF-filer med skannade bilder är en funktion som ofta efterfrågas av kunder som översätter dokument. Kunderna tycker att det är svårt att genom automatisering separera PDF-dokument som innehåller vanlig text eller skannade bilder. Detta skapar problem med arbetsflödet eftersom kunderna måste dirigera PDF-dokument med skannat bildinnehåll först till en OCR-motor innan de skickas till dokumentöversättning.
Översättningstjänster för dokument har nu intelligens
- för att identifiera om PDF-dokumentet innehåller skannade bilder eller inte,
- för att skicka PDF-filer som innehåller skannade bilder till en intern OCR-motor för att extrahera text,
- att rekonstruera det översatta innehållet som vanlig PDF-text med bibehållen ursprunglig layout och struktur.
Teckensnittsformatering som fetstil, kursiv stil, understrykning, överstrykningar etc. behålls inte för skannat PDF-innehåll eftersom OCR-tekniken för närvarande inte fångar upp dem. Teckensnittsformatering bevaras dock vid översättning av PDF-dokument med vanlig text.
Dokumentöversättning stöder för närvarande PDF-dokument som innehåller skannade bilder. från 68 källspråk till 87 målspråk. Stöd för ytterligare käll- och målspråk kommer att läggas till i sinom tid.
Nu är det enklare för kunderna att skicka alla PDF-dokument direkt till Document translation och låta den bestämma när och hur OCR-motorn ska användas effektivt.
För kunder som redan använder dokumentöversättning krävs ingen kodändring för att kunna använda den nya funktionen. PDF-dokument med skannat innehåll kan skickas in för översättning som alla andra dokumentformat som stöds.
Vi är också glada att kunna meddela att dokumentöversättningen ger stöd för skannade PDF-dokument utan extra kostnad för kunderna. Två prisplaner finns tillgängliga för dokumentöversättning via Azure - Pay-as-you-go plan och D3 volymrabattplan för större volymer av dokumentöversättning. Information om prissättningen finns på följande adress aka.ms/TranslatorPricing.
Lär dig hur du kommer igång med dokumentöversättning på aka.ms/DocumentTranslationDocs.
Skicka din feedback till mtfb@microsoft.com.