跨庫語音情感識別技術研究

跨庫語音情感識別技術研究

《 跨庫語音情感識別技術研究》是2019年11月1日江蘇大學出版社出版的圖書,作者是周鋒、張昕然。

基本介紹

  • 中文名: 跨庫語音情感識別技術研究
  • 作者:周鋒、張昕然
  • 出版社:江蘇大學出版社
  • ISBN:9787568412230
內容簡介,圖書目錄,

內容簡介

《跨庫語音情感識別技術研究》主要從兩大方面對跨資料庫的語音情感識別技術進行了研究:(1)從識別模型本身的角度出發,提出和改進一些方法來適應多資料庫來源引起的樣本空間失衡問題,進而提高SER系統的魯棒性;(2)從特徵的角度考慮,尋找新的特徵類型來補充原有的特徵空間,並將現有的特徵進行優選和融合,提升它們在跨資料庫任務中的有效性。

圖書目錄

第1章 緒論
1.1 研究背景與意義
1.1.1 語音情感的聲學意義
1.1.2 情感計算
1.1.3 實際套用
1.1.4 語音情感識別的研究現狀
1.2 跨資料庫語音情感識別技術
1.2.1 發展歷史
1.2.2 研究現狀和存在的問題
1.3 研究的主要工作
1.4 章節安排
第2章 資料庫和特徵分析
2.1 語音情感資料庫
2.1.1 國外語料庫
2.1.2 國內語料庫
2.1.3 本書使用的資料庫情況
2.1.4 跨庫情感類別劃分規則的制訂
2.2 特徵分析
2.2.1 聲學特徵
2.2.2 底層聲學描述符
2.2.3 語譜圖特徵
2.3 性能評價標準討論
第3章 基於無限t分布的混合魯棒模型
3.1 引言
3.2 基於統計模型的特徵選擇方案
3.3 iSMM特徵優選模型
3.3.1 學生t分布特徵選擇
3.3.2 特徵機率分布建模
3.3.3 判決函式評估
3.3.4 高維特徵空間分析
3.4 實驗結果
3.4.1 實驗設定
3.4.2 表演型語料庫實驗
3.4.3 自髮型語料庫實驗
3.4.4 多資料庫綜合實驗分析
3.5 本章小結
第4章 改進的LDA核K近鄰分類方法
4.1 引言
4.2 結合LDA的核K近鄰分類方法
4.2.1 基於核學習的KNN算法
4.2.2 恃征線重心法的改進
4.2.3 線性判別分析的改進
4.3 實驗結果分析
4.3.1 幾種KNN分類器對比實驗
4.3.2 兩種降維方案的情感識別實驗
4.3.3 與常用分類方法對比實驗
4.3.4 分類方案參數實驗分析
4.4 本章小結
第5章 改進的聽覺注意模型語譜圖特徵提取
5.1 引言
5.2 基於聽覺注意的語譜圖情感特徵提取
5.2.1 語譜圖特徵的語音情感識別
5.2.2 基於時頻原子的改進
5.2.3 聽覺注意圖譜特徵提取
5.3 仿真實驗
5.3.1 跨庫實驗設定
5.3.2 實驗結果和分析
5.4 本章小結
第6章 基於深度信念網路的特徵融合
6.1 引言
6.2 選擇注意機制的語譜圖特徵提取
6.2.1 提取語譜圖
6.2.2 高斯金字塔分解
6.2.3 獲取特徵圖並重構特徵矩陣
6.3 深度信念網路模型
6.3.1 受限玻爾茲曼機
6.3.2 基於對比散度的快速學習算法
6.3.3 DBN21與DBN22模型
6.4 跨庫實驗結果與分析
6.4.1 實驗準備
6.4.2 語譜圖特徵跨庫實驗
6.4.3 傳統聲學特徵跨庫實驗
6.4.4 融合特徵跨庫實驗
6.5 本章小結
第7章 跨語言的多說話人特徵自適應
7.1 引言
7.2 特徵分析
7.2.1 增強
7.2.2 自適應規整化語譜圖特徵
7.3 特徵自適應方法
7.3.1 說話人加性方差模型
7.3.2 基於GMM的加性模型
7.3.3 學生t分布對差異特徵空間的建模
7.4 .情感分類器模型
7.4.1 核K近鄰情感分類器
7.4.2 SVM情感分類器
7.5 跨語言語音情感識別實驗
7.5.1 資料庫設定
7.5.2 說話人自適應實驗
7.5.3 線上特徵自適應實驗
7.5.4 譜特徵對比實驗
7.6 本章小結
第8章 總結與展望
8.1 工作總結
8.2 後續工作與展望
參考文獻

相關詞條

熱門詞條

聯絡我們