語音信號處理(2023年清華大學出版社出版的圖書)

語音信號處理(2023年清華大學出版社出版的圖書)

本詞條是多義詞,共4個義項
更多義項 ▼ 收起列表 ▲

《語音信號處理》是2023年清華大學出版社出版的圖書,作者是洪弘、陶華偉、薛彪、趙力。

基本介紹

  • 中文名:語音信號處理
  • 作者:洪弘、陶華偉、薛彪、趙力
  • 出版時間:2023年6月1日
  • 出版社:清華大學出版社
  • ISBN:9787302635482 
  • 定價:69.80 元
內容簡介,圖書目錄,

內容簡介

本書為語音信號處理領域的指導書。作者在東南大學、南京理工大學開設的本科生課程的基礎上,介紹了語音信號處理的基本原理、分析方法以及該學科領域近年來取得的一些研究成果和技術,在理論和套用之間達到了極好的平衡。全書共11章,內容包括: 緒論、語音信號處理的聲學理論與模型、傳統語音信號分析方法、現代語音信號處理方法、語音信號的參數估計、語音編碼、語音增強、語音合成、語音識別、說話人識別、語音信號中的情感信息處理。另外,在本書的每章中都加入了複習題,供讀者思考。

圖書目錄

目錄
第1章緒論
1.1語音信號處理的發展歷史
1.1.1經典語音信號處理技術
1.1.2新興的語音信號處理技術
1.2語音信號處理的研究內容
1.3本書的結構
第2章語音信號處理的聲學理論與模型
2.1概述
2.2語音信號處理的聲學基礎
2.2.1語音的產生
2.2.2語音信號的感知
2.2.3掩蔽效應
2.3語音生成的數學模型
2.3.1激勵模型
2.3.2聲道模型
2.3.3輻射模型
2.4語音信號的特性分析
2.4.1語音信號的時域波形和頻譜特性
2.4.2語音信號的語譜圖
2.4.3語音信號的統計特性
2.5語音學基本概念
2.5.1語音學
2.5.2語音的分類及其聲學特徵
2.5.3漢語語音學
2.6小結
複習思考題
第3章傳統語音信號分析方法
3.1概述
3.2語音信號數位化和預處理
3.2.1數位化
3.2.2預處理
3.3端點檢測
3.3.1雙門限法
3.3.2相關法的端點檢測
3.3.3能零比雙門限法
3.4語音信號的時域分析
3.4.1短時能量及短時平均幅度分析
3.4.2短時過零率分析
3.4.3短時相關分析
3.4.4短時平均幅度差函式
3.5語音信號的頻域分析
3.5.1利用短時傅立葉變換求語音的短時譜
3.5.2語音的短時譜的臨界帶特徵矢量
3.6語音信號的線性預測(LPC)分析
3.6.1線性預測分析的基本原理
3.6.2線性預測方程組的求解
3.6.3LPC譜估計和LPC復倒譜
3.6.4線譜對(LSP)分析
3.7小結
複習思考題
第4章現代語音信號處理方法
4.1概述
4.2同態信號處理
4.2.1同態信號處理的基本原理
4.2.2語音信號的復倒譜
4.2.3語音信號兩個卷積分量的復倒譜
4.2.4語音信號倒譜分析實例
4.3小波變換
4.3.1小波變換的基本原理
4.3.2常用小波函式的介紹
4.3.3小波基和分解層數的選擇
4.3.4語音信號小波變換分析實例
4.4Teager能量操作
4.4.1連續時間和離散時間的能量操作
4.4.2連續時間和離散時間的能量分離(ESA)
4.4.3語音信號Teager能量運算元分析實例
4.5希爾伯特黃變換
4.5.1希爾伯特黃變換的起源
4.5.2經驗模式分解
4.5.3希爾伯特黃變換的時頻譜
4.6經驗小波變換
4.6.1經驗小波的定義
4.6.2傅立葉頻譜劃分
4.6.3窗的選取
4.6.4經驗小波變換及其改進算法
4.6.5語音信號經驗小波變換分析實例
4.7小結
複習思考題
第5章語音信號的參數估計
5.1概述
5.2基音周期估計
5.2.1基音周期估計分類
5.2.2基於自相關的基音周期估計
5.2.3基於平均幅度差函式(AMDF)的基音周期估計
5.2.4基於倒譜法(CEP)的基音周期估計
5.2.5基於簡化的逆濾波跟蹤(SIFT)的基音周期估計
5.2.6基於小波變換的基音周期估計
5.2.7基於倒譜和希爾伯特黃變換的基音周期估計
5.2.8基於系綜經驗模式分解的動態基音周期估計
5.2.9基於系綜經驗模式分解和倒譜法的基音周期估計
5.2.10基音周期估計的後處理
5.3共振峰估計
5.3.1傳統的共振峰估計方法
5.3.2基於希爾伯特黃變換的漢語共振峰估計
5.4梅爾頻率倒譜係數
5.4.1梅爾濾波器組
5.4.2MFCC特徵參數提取
5.5小結
複習思考題
第6章語音編碼
6.1概述
6.2語音信號壓縮編碼的原理
6.2.1語音編碼分類
6.2.2語音壓縮的基本原理
6.3語音編碼的關鍵技術
6.3.1線性預測
6.3.2合成分析法(AnalysisBySynthesis)
6.3.3感覺加權濾波器
6.4語音編碼的性能指標和評測方法
6.4.1主觀評價
6.4.2客觀評價
6.5語音信號的波形編碼
6.5.1脈衝編碼調製(PCM)
6.5.2自適應預測編碼(APC)
6.5.3自適應增量調製(ADM)
6.5.4自適應差分脈衝編碼調製(ADPCM)
6.5.5子帶編碼(SBC)
6.5.6自適應變換編碼(ATC)
6.6語音信號的參數編碼
6.6.1線性預測聲碼器
6.6.2LPC10編碼器
6.7語音信號的混合編碼
6.8現代通信中的語音信號編碼方法
6.8.1EVS編碼器概述
6.8.2EVS編碼器設計指標
6.8.3EVS編碼涉及的關鍵技術
6.8.4EVS編碼器評價
6.9小結
複習思考題
第7章語音增強
7.1概述
7.2語音特性、人耳感知特性
7.2.1語音特性
7.2.2人耳感知特性
7.3傳統語音增強技術
7.3.1基於濾波法的語音增強技術
7.3.2基於減譜法的語音增強技術
7.3.3基於Weiner濾波法的語音增強技術
7.3.4基於模型的語音增強技術
7.3.5基於聽覺掩蔽的語音增強技術
7.3.6基於時域處理的語音增強技術
7.4現代語音增強技術
7.4.1基於非負矩陣分解的語音增強技術
7.4.2基於DNN頻譜映射的語音增強技術
7.5小結
複習思考題
第8章語音合成
8.1概述
8.2共振峰合成法
8.3線性預測合成法
8.4神經網路語音合成法
8.5語音合成專用硬體簡介
8.6PSOLA算法合成語音
8.7文語轉換系統(TTS)
8.7.1文語轉換系統的組成
8.7.2連讀語音的韻律特性
8.7.3文本分析方法
8.7.4語音合成方法
8.7.5語音合成中的韻律控制
8.8小結
複習思考題
第9章語音識別
9.1概述
9.2語音識別原理和識別系統的組成
9.2.1預處理和參數分析
9.2.2語音識別
9.2.3語音識別系統的基本資料庫
9.3動態時間規整(DTW)
9.4孤立字(詞)識別系統
9.4.1基於MQDF的漢語塞音語音識別系統
9.4.2基於機率尺度DP識別方法的孤立字(詞)識別系統
9.5連續語音識別系統
9.5.1聲學基元模型
9.5.2系統語言模型
9.5.3句法分析和單詞的預測方法
9.6連續語音識別系統的性能評測
9.6.1連續語音識別系統的評測方法以及系統複雜性和識別能力的測度
9.6.2綜合評估連續語音識別系統時需要考慮的其他因素
9.7基於DNNHMM的語音識別系統
9.8小結
複習思考題
第10章說話人識別
10.1概述
10.2說話人識別方法和系統結構
10.2.1預處理
10.2.2說話人識別的特徵提取
10.2.3特徵參量評價方法
10.2.4模式匹配方法
10.2.5說話人識別中判別方法和閾值的選擇
10.2.6說話人識別系統的評價
10.3套用DTW的說話人確認系統
10.4套用VQ的說話人識別系統
10.5套用HMM的說話人識別系統
10.5.1基於HMM的與文本有關的說話人識別
10.5.2基於HMM的與文本無關的說話人識別
10.5.3基於HMM的指定文本型說話人識別
10.5.4說話人識別HMM的學習方法
10.5.5魯棒的HMM說話人識別技術
10.6套用GMM的說話人識別系統
10.6.1GMM模型的基本概念
10.6.2GMM模型的參數估計
10.6.3訓練數據不充分的問題
10.6.4GMM模型的識別問題
10.6.5套用GMM和BP網路的說話人識別系統
10.7套用深度學習的說話人識別
10.7.1基於DNNUBM模型的說話人識別
10.7.2說話人識別中的embeddings特徵
10.8說話人識別中尚需進一步探索的研究課題
10.8.1基礎性的課題
10.8.2實用性的問題
10.9語種辨識的原理和套用
10.9.1語種辨識的基本原理和方法
10.9.2語種辨識的套用領域
10.10小結
複習思考題
第11章語音信號中的情感信息處理
11.1概述
11.2語言信號中的情感分類和情感特徵分析
11.2.1語音情感識別系統模型
11.2.2語音信號中的情感分類
11.2.3語料庫
11.2.4語音情感特徵分析
11.2.5語音情感識別特徵分析方法
11.3基於融合特徵的語音情感識別方法
11.3.1特徵提取
11.3.2分類器
11.3.3仿真實驗
11.4基於LSTM的語音情感識別方法
11.4.1LSTM實現原理
11.4.2套用LSTM的語音情感識別
11.4.3仿真實驗
11.5基於CNN的語音情感識別方法
11.5.1卷積神經網路(CNN)
11.5.2基於CNN的語音情感識別模型
11.5.3仿真實驗
11.6小結
複習思考題
漢英名詞術語對照

相關詞條

熱門詞條

聯絡我們