使用 Watson Text to Speech 合成語音
Watson Text to Speech 服務為您的應用程式提供語音合成功能,以將書面文字轉換成自然語音。 該服務提供有 HTTP 及 WebSocket 介面,可在最大限度減少延遲的情況下,將結果以串流形式傳回給客戶。 利用 WebSocket 介面,該服務可傳回單字計時資訊,以同步輸入文字及所產生的音訊。
服務 此服務依預設無法使用。 管理者必須在 IBM® Cloud Pak for Data 平台上安裝此服務,並且必須為您提供服務存取權。 若要判定是否已安裝此服務,請開啟服務型錄,並檢查服務是否已啟用。
Watson Text to Speech 服務可將文字合成為多種格式的音訊,而且可針對各種語言和方言來產生男性和女性語音。 該服務可提供連續、加強的自然語音。 該服務接受純文字以及使用 XML 型語音合成標記語言 (SSML) 來標註的文字。 該服務延伸 SSML 以支持有表現力的語調,並且提供有語音轉換功能,可透過控制音高、速率和音色等層面來擴增可能的語音範圍。 該服務還提供有一個自訂作業介面,供您用來指定對於輸入中出現的非常用單字,該服務如何發音。 您可以使用國際音標 (IPA) 或 IBM Symbolic Phonetic Representation (SPR) 來定義發音。
入門
存取服務實例
- 導覽至 IBM Cloud Pak for Data 實例並登入。
- 從主要導覽區選取我的實例。
- 在佈建的實例標籤上,尋找您的 Watson Text to Speech 實例,然後將游標移至最後一個直欄上,以尋找並按一下省略符號圖示。 選擇檢視詳細資料。
- 按一下開啟 Watson Text to Speech。