語音信號處理實用教程

語音信號處理實用教程

《語音信號處理實用教程》是2015年人民郵電出版社出版的圖書,作者是吳進。本書系統地介紹了語音信號處理的相關知識,系統地論述了語音信號處理的基礎、概念、原理、方法與套用,以及該學科領域取得的一些新成果、新進展及新技術。

基本介紹

  • 書名:語音信號處理實用教程
  • 作者:吳進 
  • 出版社人民郵電出版社
  • 出版時間:2015年02月
  • 頁數:338 頁
  • 開本:16 開
  • ISBN:978-7-115-38087-6
內容簡介,圖書目錄,

內容簡介

語音信號處理是研究用數位訊號處理技術對語音信號進行處理的一門學科,是一門新興的交叉學科。涉及到數位訊號處理、模式識別、語言學、生理學及認知學科和人工智慧等許多學科領域。從技術角度講,語音信號處理是信息高速公路、多媒體技術、辦公自動化、現代通信及智慧型系統等新興領域套用的核心技術之一。用數位化的方法進行語音的傳送、存儲、識別、合成、增強等是整個數位化通信網中最重要、最基本的組成部分之一。計算機和積體電路技術的發展,推動了語音信號處理的實用化。 內容包括緒論、語音信號處理基礎知識、語音信號時域分析、語音信號頻域分析、語音信號的同態處理和倒譜分析、矢量量化技術、神經網路在語音信號處理中的套用、語音識別、說話人識別、語音增強等內容,以及語音信號的線性預測分析、矢量量化技術、隱馬爾可夫模型、語音編碼、語音合成、語音信號處理實驗等內容,同時學會用MATLAB語言來處理實際的語音信號。

圖書目錄

第1篇 語音信號處理基礎篇
第1章 緒 論
1.1 語音信號處理概述
1.2 語音信號處理的發展
1.3 語音信號處理的套用
思考與練習
第2章 語音信號處理的基礎知識
2.1 語音和語言
2.2 語音產生的過程及其聲學特性
2.2.1 語音的發音器官
2.2.2 人類語音的產生過程
2.2.3 共振峰頻率
2.3 語音信號的聲學特性
2.3.1 語音信號的物理屬性
2.3.2 語音信號的統計特性
2.3.3 語音信號的時間波形和頻譜特性
2.4 語音信號產生的數字模型
2.4.1 激勵模型
2.4.2 聲道模型
2.4.3 輻射模型
2.4.4 完整的語音信號數字模型
2.5 人類的聽覺功能
2.5.2 聽覺感知
2.5.3 聲音三要素
2.5.4 聽覺掩蔽效應
思考與練習
第2篇 語音信號處理分析篇
第3章 語音信號的時域分析
3.1 語音信號的數位化和預處理
3.1.1 取樣和量化
3.1.2 預處理
3.1.3 語音信號的加窗處理
3.2 短時能量分析
3.2.1 短時平均能量
3.2.2 短時平均幅度
3.3 短時過零分析
3.4 短時相關分析
3.4.1 短時自相關函式
3.4.2 修正的短時自相關函式
3.4.3 短時平均幅度差函式
3.5 基音周期估值
3.5.1 基於短時自相關法的基音周期估值
3.5.2 基於短時平均幅度差函式AMDF法的基音周期估值
3.5.3 基音周期估值的後處理
思考與練習
第4章 語音信號的頻域分析
4. 2 短時傅立葉變換的兩種解釋
4.2.1 標準傅立葉變換的解釋
4.2.2 濾波器的解釋
4.3 短時傅立葉變換的取樣率
4.3.1 時域取樣率
4.3.2 頻域取樣率
4.3.3 總取樣率
4.4 語音信號的短時綜合
4.4.1 濾波器組求和法
4.4.2 快速傅立葉變換求和法
4.5 語譜圖
思考與練習
第5章 語音信號的同態處理
5.1 卷積同態處理的基本原理
5.2 復倒譜和倒譜
5.2.1 復倒譜
5.2.2 倒譜
5.3 語音信號的復倒譜
5.3.1 聲門激勵信號的復倒譜
5.3.2 聲道衝激回響序列的復倒譜
5.4 復倒譜的幾種計算方法
5.4.1 微分法
5.4.2 最小相位信號法
5.4.3 遞推法
5.5 語音的倒譜分析及套用
5.5.1 語音同態濾波系統構成
5.5.2 語音的倒譜分析原理
5.5.3 語音的倒譜套用
思考與練習
第6章 語音信號的線性預測分析
6.1 線性預測分析的基本原理
6.1.1 信號模型
6.1.2 語音信號的線性預測模型
6.2 線性預測方程的建立
6.3 線性預測分析的經典解法
6.3.1 自相關法
6.3.2 協方差法
6.3.3 自相關法和協方差法的比較
6.4 格型法
6.4.1 格型法的基本原理
6.4.2 格型法的求解
6.5 線譜對LSP分析
6.5.1 LSP的定義和特點
6.5.2 LPC參數到LSP參數的轉換
6.5.3 LSP參數到LPC參數的轉換
6.6 導抗譜對ISP分析
6.6.1 ISP的定義和特點
6.6.2 LPC與ISP參數間的轉換
6.7 LPC導出的其它語音參數
6.7.1 反射係數
6.7.2 對數面積比係數LAR
6.7.3 LPC倒譜係數LPCC
6.8 LPC分析的頻域解釋
6.8.1 最小預測誤差的頻域解釋
6.8.2 LPC譜估計
思考與練習
第7章 語音信號的矢量量化
7.1 矢量量化的基本原理
7.1.1 矢量量化的定義
7.1.2 矢量量化系統的工作過程
7.1.3 矢量量化與標量量化的比較
7.1.4 失真測度
7.2 最佳矢量量化器
7.2.1 最佳劃分
7.2.2 最佳碼書
7.3 矢量量化器的設計算法
7.3.1 LBG算法
7.3.2 初始碼書的生成
7.3.3 空胞腔的處理
7.4 降低複雜度的矢量量化系統
7.4.1 樹形搜尋矢量量化器
7.4.2 多級矢量量化器
7.4.3 波形/增益矢量量化器
7.4.4 分離均值矢量量化器
7.4.5 有記憶的矢量量化器
7.5 語音參數的矢量量化
思考與練習
8.1 隱馬爾可夫模型的引入
8.2 隱馬爾可夫模型的定義
8.3 隱馬爾可夫模型的計算
8.3.1 機率Pr [Y/λ ]的計算
8.3.2 HMM的識別
8.4 HMM的各種結構類型
8.4.1 A矩陣參數分類
8.4.2 B矩陣參數分類
8.4.3 其他一些特殊的HMM形式
8.5 HMM的一些實際問題
8.5.1 下溢問題
8.5.2 參數的初始化問題
8.5.3 B矩陣參數的選擇
思考與練習
第9章 語音信號檢測分析
9.1 基音提取
9.1.1 自相關法
9.1.2 並行處理法
9.1.3 倒譜法
9.1.4 簡化逆濾波法
9.2 共振峰估值
9.2.1 帶通濾波器組法
9.2.2 離散傅立葉變換(DFT)
9.2.3 倒譜法
9.2.4 LPC法
思考與練習
第3篇 語音信號處理套用篇
第10章 語音編碼
10.1 語音信號的壓縮編碼原理
10.1.1 語音壓縮的基本原理
10.1.2 語音通信中的語音質量
10.1.3 語音編碼的分類
10.2 語音編碼性能的評價指標
10.2.1 編碼速率
10.2.2 編碼質量
10.2.3 編解碼延時
10.2.4 算法複雜度
10.3 語音信號波形編碼
10.3.2 自適應預測編碼APC
10.3.3 自適應差分脈衝編碼調製ADPCM
10.3.4 子帶編碼SBC
10.3.5 變換編碼TC
10.4 語音信號參數編碼
10.4.1 聲碼器的工作原理
10.4.2 相位聲碼器
10.4.3 通道聲碼器
10.4.4 共振峰聲碼器
10.4.5 同態聲碼器
10.4.6 線性預測聲碼器
10.5 語音信號混合編碼
10.5.1 合成分析技術
10.5.2 感覺加權濾波器
10.5.3 激勵模型的改進
10.5.4 G.728語音編碼標準簡介
10.6 語音信號寬頻變速率編碼
10.7 各種語音編碼方法的比較
10.7.1 波形編碼的信號壓縮技術
10.7.2 波形編碼和聲碼器的比較
10.7.3 各種聲碼器的比較
思考與練習
第11章 語音合成
11.1 概述
11.2 語音合成原理
11.2.1 波形合成法
11.2.2 參數合成法
11.2.3 規則合成法
11.3 語音合成系統的特性
11.3.1 合成單元
11.3.2 合成參數
11.3.3 合成音質
11.4 共振峰合成
11.4.1 共振峰合成原理
11.4.2 級聯型共振峰模型
11.4.3 並聯型共振峰模型
11.4.4 共振峰合成實例
11.5 線性預測合成
11.6 基音同步疊加法
11.6.1 算法原理
11.6.2 算法實現步驟
11.7 文語轉換系統
11.7.1 文語轉換系統的組成
11.7.2 漢語按規則合成
11.8 語音合成技術的套用
11.8.1 語音合成的典型套用
11.8.2 專用語音合成硬體及語音合成器晶片
思考與練習
第12章 語音識別
12.1 概述
12.2 語音識別原理
12.4 有限狀態矢量量化技術
12.4.l FSVQ原理及FSVQ聲碼器
12.4.2 FSVQ語音識別器
12.5 孤立詞識別系統
12.6.1 識別基元的選擇與切分
12.6.2 發音變化及音征提取
12.6.3 訓練及新的識別方法
12.6.4 基於HMM統一框架的大辭彙量非特定人連續語音識別
思考與練習
第13章 說話人識別
13.1 概述
13.2 特徵選取
13.2.1 說話人識別所用特徵
13.2.2 特徵類型的優選準則
13.3 說話人識別系統的結構
13.4 說話人識別中的識別方法
13.4.1 模板匹配法
13.4.2 機率統計方法
13.4.3 動態時間規整方法
13.4.4 矢量量化方法
13.4.5 隱馬爾可夫模型方法
13.4.6 人工神經網路方法
13.5 聲紋識別套用前景
13.5.1 聲紋識別特性
13.5.2 聲紋識別套用
13.5.3 聲紋識別未來
思考與練習

相關詞條

熱門詞條

聯絡我們