Deep Voice 2

產品功能

Deep Voice 2可以依靠一個半小時音頻，就能學習到一個人聲音跟別人的細微差別，而且一個系統可以學習成百上千種口音，也就是能模仿數百個人講話。

Deep Voice 2 通過尋找不同聲音之間的共享特質而學習生成語音。具體而言，每一個語音對應著單個向量，該向量大約有 50 個元素且總結了如何生成能模擬目標說話者的聲音。與以前所有的 TTS 系統不同，Deep Voice 2 可以從頭開始學習這些特質，無需任何標記語音特徵的引導。

Deep Voice 2