跳至主要內容
翻譯員

微軟翻譯器部落格

使用 Microsoft Speech 服務將端對端語音翻譯整合到您的產品中

Microsoft Speech 服務現已全面上市。作為 Azure Cognitive Services 的一部分,Speech 提供完整的語音功能,包括語音識別、翻譯,以及在一套統一且可客製化的服務中進行文字轉語音。 它結合了現有 Microsoft Translator Speech API、Bing Speech API 以及 Custom Speech Service (預覽版) 的功能。

Speech 已為企業做好準備,並可根據您的需求擴充,從原型設計到生產。它可以透過一個簡單的語音工具,加入到您的應用程式、網站和工作流程中。 天藍 訂閱。

Speech 支援 11 種語音到語音的翻譯語言。這 11 種語言中的任何一種語言的語音也可以翻譯成 60 多種文字語言。 翻譯、語音辨識和文字轉語音的支援語言清單可在 語音服務文件.

可客製化的端對端解決方案

與 Microsoft Translator Speech API 相似,Speech 翻譯服務將語音翻譯所需的所有元素整合在一個整合服務中:語音辨識包括 TrueText 文字規範化、透過 Microsoft Translator 服務進行文字翻譯,以及文字轉語音。

此外,從輸入語音辨識、翻譯到輸出文字轉語音,每個層級的語音翻譯都可自訂。

語音辨識與 TrueText 正規化:將語音音訊轉換為文字

語音經過處理後,會轉換成原始文字輸出。語音轉換完成後,TrueText 會將文字規範化,使其更適合翻譯。TrueText 可移除語音不流暢("um 「和 」ah "等填充詞)、口吃和重複。此外,還會加入分句、正確的標點符號和大小寫,以提高文字的可讀性和可翻譯性。

語音辨識可使用以下功能自訂 自訂演講.透過自訂語音,使用者可以根據自己的詞彙和獨特的說話風格建立自訂語言模型。也可以建立自訂聲學模型來適應使用者環境,以確保語音辨識能適應各種麥克風、取樣率或背景噪音。

機器翻譯:翻譯文本

轉換後的文字使用專為真實生活口語會話開發的神經機器翻譯。

自訂翻譯器 (預覽) 可讓使用者自訂 Translator 神經翻譯系統,使其成為瞭解公司或產業所用術語的系統。

使用 Custom Translator 自訂的系統可同時用於語音翻譯和文字翻譯,使用 微軟翻譯器的文字 API.

文字轉語音:從翻譯的文字產生聲音

文字轉語音 (Text-to-speech) 或語音合成 (voice synthesis),可從翻譯的文字中產生電腦製作的聲音輸出。使用者可以選擇超過 45 種語言或地區的 75 種語音,包括男聲和女聲。

自訂語音, 使用者也可以透過錄音和上傳訓練資料來自訂語音。該服務會根據您的錄音創建獨特的語音。

開始使用統一演說

在服務的 Azure 頁面.在那裡,您可以使用 30 天的試用金鑰免費測試 Microsoft 的統一語音服務。 Azure 入口網站.

可提供語言文件 這裡該應用程式提供許多快速入門、教學和使用指南,可協助您將服務新增至您的應用程式。

立即免費開始使用 Microsoft Speech。