螢石語音合成算法-1

螢石語音合成算法-1是杭州螢石軟體有限公司推出的深度合成服務算法。該算法套用於語音合成場景,根據用戶輸入的文本信息,生成對應音頻內容。主要用於螢石雲視頻(APP)。

2024年6月,螢石語音合成算法-1備案通過。

基本介紹

  • 軟體名稱:螢石語音合成算法-1
  • 開發商:杭州螢石軟體有限公司
  • 備案號:網信算備330108156993201240021號
算法原理,運行機制,套用場景,算法目的,

算法原理

螢石語音合成算法的作用對象是文本和語音數據,該模型在訓練時會學習文本及對應語音數據之間的映射關係,對於不同說話人的音色信息也包含其中。在用戶使用時,語音合成算法可以根據用戶輸入的文本輸出指定音色的語音,音色模板由系統內置。

運行機制

螢石語音合成算法整體由前端模組、聲學模組及聲碼器組成。其中前端對輸入文本進行音素轉換,這其中包括了正則化、多音字分歧、轉音素等模組,目的是將輸入文本儘可能準確地轉成音素:前端模組輸出的音素作為聲學模型的輸入進入該模組,從而生成聲學特徵:;最後聲碼器將聲學特徵轉換成最終的語音。

套用場景

螢石語音合成算法套用於智慧型物聯網領域,智慧型家居硬體設備(智慧型安防、智慧型入戶、智慧型控制、智慧型機器人)及移動網際網路應用程式(APP、小程式)。算法使用的業務場景有語音互動、語音播報、迎賓詞、語音備忘錄等,可以將信息通過聲音的形式傳遞給用戶。

算法目的

螢石語音合成算法的目的意圖實現文本轉語音功能,將用戶輸入的文本數據合成為一段自然人聲音頻。

相關詞條

熱門詞條

聯絡我們