Beolvasott PDF-dokumentumok fordítása dokumentumfordítással
Napjainkban a Dokumentumfordítás a Translator, a Microsoft Azure Cognitive Service szolgáltatás funkciója lehetővé teszi a beolvasott képtartalmat tartalmazó PDF-dokumentumok fordítását, így az ügyfeleknek nem kell előzetesen feldolgozniuk őket ocr-motoron keresztül a fordítás előtt.
A dokumentumfordítást tavaly, 2021. május 25-én tették elérhetővé általánosan, lehetővé téve az ügyfelek számára, hogy teljes dokumentumokat és dokumentumkötegeket fordítsanak le több mint 110 nyelv és dialektus az eredeti fájl elrendezésének és formázásának megőrzése mellett. A dokumentumfordítás számos fájltípust támogat, például a Wordöt, a PowerPointot és a PDF-fájlt, és az ügyfelek előre elkészített vagy egyéni gépi fordítási modelleket is használhatnak. A dokumentumfordítás nagyvállalati igényű az Azure Active Directory-hitelesítéssel, biztonságos hozzáférést biztosítva a szolgáltatás és a tárhely között a Felügyelt identitáson keresztül.
A PDF-fájlok szkennelt képtartalommal történő fordítása a dokumentumfordítási ügyfelek fokozottan igényelt szolgáltatása. Az ügyfelek nehezen tudják elkülöníteni azokat a PDF-dokumentumokat, amelyek rendszeres szöveges vagy beolvasott képtartalommal rendelkeznek automatizálással. Ez munkafolyamat-problémákat okoz, mivel az ügyfeleknek először egy OCR-motorhoz kell irányítaniuk a beolvasott képtartalmú PDF-dokumentumokat, mielőtt dokumentumfordításra küldenék őket.
A dokumentumfordítási szolgáltatások most már rendelkeznek az intelligenciával
- annak megállapítására, hogy a PDF-dokumentum tartalmaz-e beolvasott képtartalmat vagy sem,
- a beolvasott képtartalmat tartalmazó PDF-fájlokat belső OCR-motorhoz irányítani szöveg kinyerése céljából,
- a lefordított tartalom rekonstruálásához normál szöveges PDF formátumban, miközben megőrzi az eredeti elrendezést és szerkezetet.
A beolvasott PDF-tartalomhoz nem maradnak meg betűtípusformázások, például félkövérek, dőlt betűképek, aláhúzások, kiemelések stb., mivel az OCR technológia jelenleg nem rögzíti őket. A betűtípusformázás azonban megmarad a normál szöveges PDF-dokumentumok fordítása közben.
A dokumentumfordítás jelenleg támogatja a beolvasott képtartalmat tartalmazó PDF-dokumentumokat 68 forrásnyelvtől 87 célnyelvig. A további forrás- és célnyelvek támogatása a megfelelő időben hozzáadódik.
Most az ügyfelek könnyebben küldhetik el az összes PDF-dokumentumot a Dokumentum fordításnak közvetlenül, és hagyják, hogy eldöntsék, mikor és hogyan használják hatékonyan az OCR motort.
A dokumentumfordítást már használó ügyfelek számára nincs szükség kódmódosításra az új funkció használatához. A beolvasott tartalmú PDF-dokumentumok ugyanúgy elküldhetők fordításra, mint bármely más támogatott dokumentumformátum.
Örömmel jelentjük be azt is, hogy a dokumentum fordítása támogatást nyújt a beolvasott PDF-dokumentum tartalmához, további díjak nélkül az ügyfelek számára. Két díjszabási csomag érhető el az Azure-on keresztüli dokumentumfordításhoz – a használatalapú használatra és a D3 kötetkedvezmény-kedvezménycsomag a nagyobb mennyiségű dokumentumfordításhoz. Az árak részletei a következő címen találhatók: aka.ms/TranslatorPricing.
További információ a dokumentumfordítás megkezdéséről a következő címen: aka.ms/DocumentTranslationDocs.
Küldje el visszajelzését a következő címre: mtfb@microsoft.com.