Deep Voice 2

Deep Voice 2

Deep Voice 2是百度AI研發在Deep Voice上升級的一個文字轉語音的軟體

基本介紹

  • 中文名:Deep Voice 2
  • 研發:百度AI
  • 前一產品:Deep Voice
  • 作用:文字轉語音
產品功能,技術原理,產品套用,市場前景,

產品功能

Deep Voice 2可以依靠一個半小時音頻,就能學習到一個人聲音跟別人的細微差別,而且一個系統可以學習成百上千種口音,也就是能模仿數百個人講話。

技術原理

Deep Voice 2 通過尋找不同聲音之間的共享特質而學習生成語音。具體而言,每一個語音對應著單個向量,該向量大約有 50 個元素且總結了如何生成能模擬目標說話者的聲音。與以前所有的 TTS 系統不同,Deep Voice 2 可以從頭開始學習這些特質,無需任何標記語音特徵的引導。
Deep Voice 2
Deep Voice 2

產品套用

Deep Voice 2可以用於其他需要語音互動的場景下,例如個性化的語音導航、智慧型家電等,都可以使用這一功能學習個性化的語音,而無需再依賴導航產品官方發布的語音包。

市場前景

百度並不是唯一一家在這個領域探索的巨頭,2016年9月,谷歌的DeepMind團隊也發布了一款聲音合成器 WaveNet,這個軟體在聲音的質量比傳統的語音合成系統有了很大的提升。
這個賽道也有大量的創業公司。2017年4月,加拿大的創業公司 Lyrebird 就發布了一個新系統,它可以通過一分鐘的語音數據,就能模仿很多大人物說話的。

相關詞條

熱門詞條

聯絡我們