콘텐츠로 건너뛰기
번역기
이 페이지는 Microsoft 번역기의 기계 번역 서비스에서 자동으로 번역되었습니다. 자세히

마이크로 소프트 번역기 블로그

스캔한 PDF 문서를 문서 번역으로 번역

문서의 이미지를 캡처하는 데 사용되는 전화입니다.

오늘날, 문서 번역 Microsoft Azure 코그너티브 서비스인 번역기 기능은 스캔한 이미지 콘텐츠가 포함된 PDF 문서를 번역하는 기능을 추가하여 고객이 번역 전에 OCR 엔진을 통해 사전 처리할 필요가 없습니다.

문서 번역은 작년에 2021년 5월 25일에 일반 공급되어 고객이 전체 문서 및 문서 배치를 그 이상으로 번역할 수 있도록 했습니다. 110 개 언어 및 방언 원본 파일의 레이아웃과 서식을 보존하면서. 문서 번역은 Word, PowerPoint 및 PDF를 비롯한 다양한 파일 형식을 지원하며 고객은 사전 빌드된 또는 사용자 지정 기계 번역 모델을 사용할 수 있습니다. 문서 번역은 Azure Active Directory 인증을 통해 엔터프라이즈용으로 지원되며, 관리되는 ID를 통해 서비스와 저장소 간에 보안 액세스를 제공합니다.

스캔한 이미지 콘텐츠로 PDF를 번역하는 것은 문서 번역 고객이 많이 요청하는 기능입니다. 고객은 자동화를 통해 일반 텍스트가 있거나 스캔한 이미지 콘텐츠가 있는 PDF 문서를 분리하기가 어렵다는 것을 알고 있습니다. 이로 인해 고객은 스캔한 이미지 콘텐츠가 있는 PDF 문서를 문서 번역으로 보내기 전에 먼저 OCR 엔진으로 라우팅해야 하므로 워크플로 문제가 발생합니다.

문서 번역 서비스에는 이제 인텔리전스가 있습니다.

  • PDF 문서에 스캔한 이미지 내용이 포함되어 있는지 여부를 식별하려면
  • 스캔한 이미지 콘텐츠가 포함된 PDF를 내부적으로 OCR 엔진으로 라우팅하여 텍스트를 추출하려면,
  • 원본 레이아웃과 구조를 유지하면서 번역 된 내용을 일반 텍스트 PDF로 재구성합니다.

굵은색, 기울임꼴, 밑줄, 강조 표시 등과 같은 글꼴 서식은 OCR 기술이 현재 캡처하지 않으므로 스캔한 PDF 콘텐츠에 대해 유지되지 않습니다. 그러나 글꼴 서식은 일반 텍스트 PDF 문서를 번역하는 동안 유지됩니다.

문서 번역은 현재 스캔한 이미지 내용이 포함된 PDF 문서를 지원합니다. 68개의 소스 언어에서 87개의 대상 언어로. 추가 소스 및 대상 언어에 대한 지원은 당연히 추가 될 것입니다.

이제 고객이 모든 PDF 문서를 문서 번역으로 직접 보내고 OCR 엔진을 효율적으로 사용할 시기와 방법을 결정할 수 있습니다.

이미 문서 번역을 사용 중인 고객의 경우 이 새로운 기능을 사용하기 위해 코드를 변경할 필요가 없습니다. 스캔한 내용이 포함된 PDF 문서는 지원되는 다른 문서 형식과 마찬가지로 번역을 위해 제출할 수 있습니다.

또한 문서 번역이 고객에게 추가 비용 없이 스캔한 PDF 문서 콘텐츠에 대한 지원을 추가한다는 사실을 발표하게 되어 기쁩니다. Azure를 통한 문서 번역에 사용할 수 있는 가격 책정 계획, 즉 종량제 계획과 더 많은 양의 문서 번역을 위한 D3 볼륨 할인 계획이라는 두 가지 가격 책정 계획을 사용할 수 있습니다. 가격 정보는 다음에서 확인할 수 있습니다. aka.ms/TranslatorPricing.

문서 번역을 시작하는 방법 알아보기 aka.ms/DocumentTranslationDocs.
피드백을 보내 mtfb@microsoft.com.