圖書內容
本書系統介紹數字語音編碼的基本理論、技術和分析方法,主要內容包括:語音編碼發展概況,語音信號和人的聽覺特性,數字語音編碼基本技術,語音波形編碼,聲碼器,合成分析線性預測編碼。全書突出介紹多脈衝激勵、規則脈衝激勵和碼激勵線性預測編碼,其中又以套用最廣泛和最有發展前途的碼激勵線性預測編碼為重點。書中選擇GSM 13 kb/s、G.722、FED-STD1016和G.728等語音編碼標準作為實例進行詳細分析。書中安排了一定數量的習題。
目 錄
第1章 概論 1
1.1 語音編碼的目的 1
1.2 語音編碼的性能指標 2
1.2.1 語音質量 2
1.2.2 比特率 3
1.2.3 延時 4
1.2.4 算法複雜度 5
1.3 語音編碼的基本方法 6
1.4 網路通信套用中的語音編碼問題 8
1.4.1 VoIP 8
1.4.2 嵌套編碼和多模編碼 8
1.4.3 信源和信道聯合編碼 9
1.5 語音編碼標準 10
1.5.1 語音編碼標準化組織 10
1.5.2 廣泛套用的語音編碼標準 11
1.5.3 語音編碼標準的主要性能指標和套用領域 13
1.6 語音編碼研究動態 21
1.7 展望 22
習題 22
第2章 語音信號 24
2.1 語音的產生過程及其模型 24
2.1.1 人類的語音器官 24
2.1.2 人類語音的產生過程 25
2.1.3 共振峰頻率和基音頻率 25
2.1.4 描述語音產生過程的離散時間信號模型 26
2.2 語音信號的特性 27
2.2.1 語音的聲學特性 27
2.2.2 語音信號的波形 28
2.2.3 語音信號的統計特性 29
2.3 人類的聽覺功能 32
2.3.1 人的聽覺器官 32
2.3.2 耳蝸的構造 33
2.3.3 耳蝸的功能 34
2.3.4 等響度曲線 35
2.3.5 音調 37
2.3.6 臨界頻帶 37
2.3.7 聽覺掩蔽效應 40
習題 43
第3章 數字語音編碼的基本技術 45
3.1 語音信號的數位化 45
3.1.1 反混疊失真濾波和取樣 45
3.1.2 量化 46
3.1.3 量化定理 49
3.1.4 量化誤差的統計特性 53
3.1.5 信號與量化誤差的相關性 54
3.1.6 高頻顫動 56
3.1.7 量化噪聲譜整形技術 59
3.2 數字語音信號的短時時域處理 62
3.2.1 短時能量 62
3.2.2 短時平均幅度 65
3.2.3 短時平均過零率 65
3.2.4 短時自相關函式 65
3.2.5 短時平均幅度差函式 66
3.2.6 語音段起止點判別 66
3.3 語音信號的短時傅立葉變換 67
3.3.1 窗函式對短時譜的影響 67
3.3.2 短時傅立葉變換的線性濾波實現 69
3.4 語音信號的線性預測分析 69
3.4.1 線性預測原理 69
3.4.2 線性預測的規範方程 71
3.4.3 求解線性預測方程的兩種常用方法 72
3.4.4 Levinson-Durbin算法 74
3.4.5 線性預測係數與反射係數的相互轉換 77
3.4.6 協方差法 78
3.4.7 格形濾波器 81
3.4.8 Burg算法 83
3.4.9 線性預測的Schur疊代算法 84
3.4.10 線性預測的其他參數表示 92
3.5 語音信號的矢量量化 96
3.5.1 矢量量化的基本原理 96
3.5.2 失真度 96
3.5.3 碼本的設計 97
3.5.4 搜尋碼本的方法 101
習題 103
第4章 波形編碼 107
4.1 概述 107
4.2 脈衝編碼調製 108
4.2.1 均勻量化PCM 108
4.2.2 誤碼引起的信號失真 109
4.2.3 非均勻量化PCM 110
4.2.4 μ律壓擴器 111
4.2.5 A律壓擴器 113
4.2.6 μ律PCM和A律PCM的編碼規則 114
4.2.7 對數PCM與線性PCM間的轉換 116
*4.2.8 實現PCM編解碼的積體電路晶片 118
4.3 差分脈衝編碼調製 119
4.3.1 DPCM的基本原理 120
4.3.2 預測信號 的產生方法 121
4.3.3 DPCM的信號-量化噪聲比 121
4.4 增量調製 123
4.4.1 增量調製工作原理 123
4.4.2 增量調製性能分析 124
4.5 自適應量化 125
4.5.1 自適應量化的基本原理 125
4.5.2 語音信號方差的估算 126
4.5.3 自適應量化對信噪比的改善 127
4.6 自適應差分脈衝編碼調製 128
4.6.1 前饋自適應和反饋自適應預測 128
4.6.2 自適應差分脈衝編碼調製的基本原理 129
4.6.3 ADPCM系統的性能 130
4.7 子帶編碼 133
4.7.1 離散時間信號的減取樣和增取樣 133
4.7.2 短時傅立葉變換的濾波器組分析方法 137
4.7.3 子帶編碼原理方框圖 139
4.7.4 雙通道正交鏡像濾波器組 139
4.7.5 寬頻語音編碼標準G.722 142
4.8 變換編碼 153
4.8.1 變換編碼與短時傅立葉變換的關係 153
4.8.2 自適應變換編碼原理 154
*4.8.3 酉變換的選擇 156
4.8.4 變換係數的量化 156
4.8.5 比特分配 157
4.8.6 譜的參數化和變換編碼的自適應 158
*4.8.7 自適應變換編碼設計的典型參數舉例 161
習題 163
第5章 聲碼器 165
5.1 聲碼器工作原理 165
5.2 通道聲碼器和共振峰聲碼器 166
*5.3 同態聲碼器 169
5.3.1 卷積同態系統 169
5.3.2 復倒譜與倒譜 170
5.3.3 語音信號的倒譜分析 170
5.3.4 同態聲碼器原理 173
5.4 線性預測聲碼器 174
5.4.1 線性預測聲碼器的基本原理 174
5.4.2 線性預測參數的量化 175
5.4.3 線性預測聲碼器的實例 176
5.5 激勵源模型 178
5.5.1 兩狀態激勵模型 178
5.5.2 混合激勵模型 179
5.5.3 脈衝和噪聲混合比例的控制方法 180
5.5.4 脈衝位置抖動器 180
5.5.5 濁音激勵的周期性和脈衝性 182
5.5.6 混合激勵模型的進一步改進 183
*5.5.7 採用改進混合激勵模型的聲碼器實例 188
5.5.8 殘差激勵線性預測 189
5.6 基音估計 191
5.6.1 基音檢測的困難 192
5.6.2 基音檢測算法的類型 192
5.6.3 基音檢測算法 193
5.7 LPC-10和LPC-10e聲碼器 196
5.7.1 LPC-10聲碼器的編碼原理 197
5.7.2 LPC-10聲碼器的解碼原理 200
*5.7.3 LPC-10e聲碼器 202
習題 204
第6章 合成分析線性預測編碼 205
6.1 合成分析線性預測編碼原理 205
6.2 多脈衝激勵線性預測編碼器 207
6.2.1 多脈衝激勵的物理基礎 207
6.2.2 多脈衝激勵信號疊代最佳化計算過程 208
*6.2.3 多脈衝激勵線性預測編碼實例 211
6.2.4 9.6 kb/s MPLP編碼算法 212
6.3 規則脈衝激勵線性預測編碼 213
6.3.1 規則脈衝激勵信號的最佳化過程 214
6.3.2 規則脈衝激勵信號的最佳化 214
*6.3.3 激勵信號最佳化算法的改進 216
6.4 GSM 13 kb/s語音編碼器 219
6.4.1 背景介紹 219
6.4.2 GSM語音編碼器工作原理 220
6.4.3 GSM 13 kb/s語音編碼器的解碼原理 225
6.4.4 GSM 13 kb/s語音編碼器的主要性能 226
6.5 碼激勵線性預測編碼技術 227
6.5.1 概述 227
6.5.2 CELP編碼器基本原理 228
6.5.3 傳統CELP編碼器的碼本搜尋算法 230
*6.6 CELP編碼器搜尋最優激勵碼矢的快速方法 234
6.6.1 矩陣奇異值分解搜尋方法 234
6.6.2 頻域搜尋方法 235
6.6.3 自相關搜尋方法 236
6.6.4 稀疏矢量搜尋方法 237
6.6.5 譜分類搜尋方法 240
6.6.6 利用代數碼、短激勵序列和樹碼加快碼本搜尋 241
6.7 CELP編碼器中預測器參數的計算 242
6.7.1 計算預測器參數的通用模型 242
6.7.2 共振峰預測器參數的計算 245
6.7.3 基音預測器參數的開環計算方法 246
6.7.4 修正協方差法 248
6.7.5 共振峰預測器和基音預測器的計算順序 250
*6.7.6 長時合成濾波器的穩定性分析 252
6.7.7 基音周期(或基音滯後時間)的估計 253
6.7.8 基音預測器參數的閉環計算方法 255
*6.8 基音預測器與共振峰預測器的開環聯合最佳化 257
6.8.1 組合結構聯合最佳化方法 258
6.8.2 級聯結構聯合最佳化方法 258
6.8.3 開環聯合最佳化濾波器的性能 261
6.8.4 開環聯合最佳化中的穩定性問題 263
6.8.5 最小相位開環計算聯合最佳化方法 263
6.9 基音預測器與共振峰預測器的閉環聯合最佳化 266
*6.10 基於維納濾波的聯合最佳化方法 269
6.10.1 開環維納濾波 269
6.10.2 閉環合成分析 271
6.11 FED-STD1016語音編碼標準 274
6.11.1 基本工作原理 274
6.11.2 碼本構成方法 275
6.11.3 自適應碼本編碼表 280
6.11.4 固定碼本和自適應碼本的增益的編碼 281
6.11.5 解碼器中的後置濾波器 282
6.11.6 FED-STD1016編碼標準的主要性能指標 282
6.12 G.728語音編碼標準 283
6.12.1 G.728的編碼和解碼原理 283
6.12.2 G.728的解碼器 292
6.12.3 G.728編解碼器中各種計算的時間安排 297
習題 299
附錄A 英文縮略詞中英文對照表 302
參考文獻