自動說話人識別方法與新技術

自動說話人識別方法與新技術

《自動說話人識別方法與新技術》是2012年出版的圖書,作者是丁輝。

基本介紹

  • 作者:丁輝
  • ISBN:9787121189784
  • 頁數:240
  • 定價:58.00元
  • 出版時間:2012-12
內容簡介,目錄,

內容簡介

在生物識別技術中,自動說話人識別技術具有獨特的套用領域。本書在介紹自動說話人識別基本原理的基礎上,重點介紹在說話人特徵提取魯棒性技術方面,基於GMM、SVM、VQ新技術說話人識別系統方面,以及在漢語說話人識別方面的最新研究成果。
本書可供信息工程、電子工程、計算機科學與技術、公安、軍事偵察等領域的科技工作者閱讀,也可作為信號與信息處理、通信與電子系統、模式識別、生物醫學專業的教學參考書。

目錄

第1章 緒 論 1
1.1 自動說話人識別及其研究意義 1
1.2 說話人識別技術的特點和難點 4
1.3 說話人識別研究的歷史與現狀 6
第2章 說話人識別基本原理 12
2.1 說話人識別的語音學基礎 12
2.2 說話人識別系統結構 17
2.3 特徵提取 19
2.4 說話人識別模型 27
2.5 得分規整及判決 29
2.6 說話人識別語音庫與說話人識別系統的評測 30
2.6.1 說話人識別系統評測的基本方法 30
2.6.2 說話人識別語音庫 33
2.6.3 說話人識別系統的評測 38
第3章 說話人特徵提取方法與魯棒性技術 43
3.1 說話人特徵提取的基本方法 43
3.1.1 基音周期 46
3.1.2 線性預測分析與線性預測係數 47
3.1.3 線性預測復倒譜係數 51
3.1.4 美爾頻率倒譜係數 52
3.2 說話人特徵提取面臨的問題 55
3.3 說話人特徵提取的魯棒性技術 56
3.3.1 基於線性預測殘差倒譜的基音檢測 56
3.3.2 基於小波複合技術的噪聲環境的特徵提取 63
3.3.3 基於規整最小方差無失真回響技術的回聲環境特徵提取 65
3.3.4 基於自適應頻率規整與語音頻譜增強的特徵提取 73
第4章 基於多步聚類和特徵補償GMM的說話人識別技術 86
4.1 說話人識別的GMM基本模型 86
4.1.1 說話人辨認系統 86
4.1.2 GMM說話人模型 87
4.2 基於GMM的說話人識別的技術難點 89
4.3 基於嵌入變換的多步聚類變換GMM的說話人識別 90
4.3.1 基於嵌入變換的對角方差GMM 90
4.3.2 基於對角方差矩陣的多步聚類EM算法 93
4.3.3 實驗與結果分析 97
4.4 基於加權特徵補償變換GMM的說話人識別 104
4.4.1 引言 104
4.4.2 前端處理 106
4.4.3 加權特徵補償變換算法 110
4.4.4 實驗與結果分析 115
第5章 基於VQ說話人識別方法與碼本協方差矩陣跡技術 122
5.1 VQ基本方法 122
5.2 基於碼本協方差矩陣跡VQ技術的說話人識別 123
5.2.1 基於碼本協方差矩陣跡的VQ技術 123
5.2.2 基於碼本協方差矩陣跡VQ技術的說話人識別技術 123
第6章 基於SVM的說話人識別方法與加權LS-SVM技術 128
6.1 說話人識別的SVM基本方法 128
6.2 基於LS-SVMs多級分類的說話人識別技術 130
6.2.1 LS-SVMs實現的多分類 130
6.2.2 基於LS-SVMs的兩級分類的說話人識別模型 132
6.2.3 實驗與結果分析 133
6.3 基於加權LS-SVM的易擴展說話人識別技術 136
6.3.1 易擴展的LS-SVM多分類方式 136
6.3.2 “一對一”LS-SVM的權值 138
6.3.3 基於加權LS-SVM的說話人辨認 141
6.3.4 實驗與結果分析 142
第7章 基於自適應直方圖均衡化的魯棒性說話人識別技術 144
7.1 語音魯棒性技術 144
7.2 直方圖均衡化 146
7.2.1 直方圖均衡化原理 146
7.2.2 分位差直方圖均衡化法 149
7.2.3 數據擬合直方圖均衡化 150
7.3 改進的自適應直方圖均衡化 152
7.3.1 問題的提出 152
7.3.2 自適應直方圖均衡化方法 153
7.4 實驗與結果分析 155
7.4.1 變換性能實驗 156
7.4.2 效率比較實驗 160
7.4.3 識別性能比較實驗 162
第8章 基於分層採樣KNN的說話人識別方法與技術 165
8.1 KNN算法 165
8.2 基於分層採樣的KNN算法 166
第9章 基於元音映射的漢語說話人識別方法與技術 169
9.1 漢語說話人識別基本方法 169
9.1.1 漢語語音基本特性 169
9.1.2 漢語說話人識別基本方法 174
9.2 基於漢語元音映射的漢語說話人特徵提取 175
9.2.1 漢語元音映射原理 176
9.2.2 二合元音共振峰分析 179
9.2.3 韻母元音分解的識別性能 182
9.2.4 基於頻域能量分布分析的元音幀提取 183
9.3 基於漢語元音映射和仿生識別技術的漢語說話人識別 190
9.3.1 基於漢語元音映射的說話人識別框架 190
9.3.2 基於仿生模式識別技術的漢語說話人識別 192
9.3.3 實驗與結果分析 196
第10章 小樣本環境下單元音相關漢語說話人識別技術 202
10.1 漢語韻母與單元音映射關係 203
10.2 基於單元音映射的漢語說話人識別框架 204
10.3 基於LS-SVM的單元音分類方法 206
10.3.1 LS-SVM分類器 206
10.3.2 基於LS-SVM的單元音分類器 207
10.4 基於單元音映射的綜合判決 209
10.4.1 音素級綜合判決策略 209
10.4.2 幀序列識別結果融合策略 212
10.5 實驗與結果分析 212
第11章 基於得分規整策略的說話人確認技術 214
11.1 基於EMD-Tnorm的得分歸一化算法在魯棒說話人確認
系統中的套用 215
11.1.1 測試規整算法 215
11.1.2 EMD理論 216
11.1.3 MixMax模型 217
11.1.4 基於EMD-Tnorm的得分規整策略 219
11.2 實驗與結果分析 221
11.2.1 預處理和特徵提取 221
11.2.2 性能評估指標 221
11.2.3 實驗過程與結果 222
參考文獻 225
後記 231

相關詞條

熱門詞條

聯絡我們