智慧型語音處理

內容簡介

本書從智慧型化社會對語音處理提出的新要求出發，系統地介紹了智慧型語音處理涉及的基礎理論、基本技術、主要方法以及典型的智慧型語音處理套用，理論與實際緊密結合，適合作為高等院校人工智慧、電子信息工程、物聯網工程、數據科學與大數據技術、通信工程等專業高年級本科生以及智慧型科學與技術、信號與信息處理、網路空間安全、通信與信息系統等學科研究生的參考教材，也可供從事語音處理技術研究與套用的科研及工程技術人員參考。

本書共11章，可分為四個部分。

*部分是導論，對應第1章，概要介紹了經典語音處理與智慧型語音處理的基本概念以及語音處理的典型套用。

第二部分是基礎理論，包括第2～5章。第2章介紹了稀疏和稀疏表示、冗餘字典以及壓縮感知的基本原理和方法；第3章介紹了隱變數模型，包括高斯混合模型、隱馬爾可夫模型和高斯過程隱變數模型等；第4章主要介紹主成分分析和非負矩陣分解兩種典型的組合模型；第5章主要介紹人工神經網路和深度學習的基礎知識以及深度神經網路的典型結構。

第三部分是套用實踐，包括第6～10章。第6章綜合利用稀疏表示、字典學習、深度學習等智慧型處理技術，分別介紹基於K-L展開的字典學習的語音壓縮感知、基於梅爾倒譜係數重構的抗噪低速率語音編碼以及基於深度自編碼器的抗噪低速率語音編碼這三種方案；第7章重點介紹了基於非負矩陣分解和基於深度學習的智慧型語音增強方法；第8章在介紹語音轉換的基本原理的基礎上，重點介紹了基於非負矩陣分解和基於深度神經網路的譜轉換方法；第9章首先介紹了說話人識別系統的框架和模型，然後分別介紹了基於i-vector和基於深度神經網路的說話人識別方法；第10章在介紹骨導語音特性和骨導語音盲增強的基本原理的基礎上，分別介紹了基於長短時記憶網路和基於均衡-生成組合譜映射的骨導語音盲增強方法。

第四部分是結束語，對應第11章，對全書進行了總結，並對智慧型語音處理的未來發展進行展望。

圖書目錄

前言

1章智慧型語音處理導論1

1.1 概述1

1.2 經典語音處理2

1.2.1 語音處理的發展2

1.2.2 語音基本表示方法3

1.2.3 語音處理基本方法3

1.2.4 經典語音處理方法的不足4

1.3 智慧型語音處理5

1.3.1 智慧型語音處理的基本概念5

1.3.2 智慧型語音處理的基本框架5

1.3.3 智慧型語音處理的基本模型6

1.4 語音處理的套用7

1.4.1 語音處理的傳統套用領域8

1.4.2 語音處理的新套用領域11

1.5 小結14

參考文獻14

2章稀疏和壓縮感知15

2.1 引言15

2.2 稀疏和稀疏表示16

智慧型語音處理

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條