使用 Microsoft Speech 服務將端對端語音翻譯整合到您的產品中

發佈於 2018 年 9 月 24 日2019 年 3 月 15 日由微軟翻譯器

Microsoft Speech 服務現已全面上市。作為 Azure Cognitive Services 的一部分，Speech 提供完整的語音功能，包括語音識別、翻譯，以及在一套統一且可客製化的服務中進行文字轉語音。它結合了現有 Microsoft Translator Speech API、Bing Speech API 以及 Custom Speech Service (預覽版) 的功能。

Speech 已為企業做好準備，並可根據您的需求擴充，從原型設計到生產。它可以透過一個簡單的語音工具，加入到您的應用程式、網站和工作流程中。天藍訂閱。

Speech 支援 11 種語音到語音的翻譯語言。這 11 種語言中的任何一種語言的語音也可以翻譯成 60 多種文字語言。翻譯、語音辨識和文字轉語音的支援語言清單可在語音服務文件.

可客製化的端對端解決方案

與 Microsoft Translator Speech API 相似，Speech 翻譯服務將語音翻譯所需的所有元素整合在一個整合服務中：語音辨識包括 TrueText 文字規範化、透過 Microsoft Translator 服務進行文字翻譯，以及文字轉語音。

此外，從輸入語音辨識、翻譯到輸出文字轉語音，每個層級的語音翻譯都可自訂。

語音辨識與 TrueText 正規化：將語音音訊轉換為文字

語音經過處理後，會轉換成原始文字輸出。語音轉換完成後，TrueText 會將文字規範化，使其更適合翻譯。TrueText 可移除語音不流暢（"um 「和」ah "等填充詞）、口吃和重複。此外，還會加入分句、正確的標點符號和大小寫，以提高文字的可讀性和可翻譯性。

語音辨識可使用以下功能自訂自訂演講.透過自訂語音，使用者可以根據自己的詞彙和獨特的說話風格建立自訂語言模型。也可以建立自訂聲學模型來適應使用者環境，以確保語音辨識能適應各種麥克風、取樣率或背景噪音。

機器翻譯：翻譯文本

轉換後的文字使用專為真實生活口語會話開發的神經機器翻譯。

自訂翻譯器 (預覽) 可讓使用者自訂 Translator 神經翻譯系統，使其成為瞭解公司或產業所用術語的系統。

使用 Custom Translator 自訂的系統可同時用於語音翻譯和文字翻譯，使用微軟翻譯器的文字 API.

文字轉語音：從翻譯的文字產生聲音

文字轉語音 (Text-to-speech) 或語音合成 (voice synthesis)，可從翻譯的文字中產生電腦製作的聲音輸出。使用者可以選擇超過 45 種語言或地區的 75 種語音，包括男聲和女聲。

與自訂語音, 使用者也可以透過錄音和上傳訓練資料來自訂語音。該服務會根據您的錄音創建獨特的語音。

開始使用統一演說

在服務的 Azure 頁面.在那裡，您可以使用 30 天的試用金鑰免費測試 Microsoft 的統一語音服務。 Azure 入口網站.

可提供語言文件這裡該應用程式提供許多快速入門、教學和使用指南，可協助您將服務新增至您的應用程式。

立即免費開始使用 Microsoft Speech。

微軟翻譯器部落格

可客製化的端對端解決方案

開始使用統一演說