PyTorch語音識別實戰

內容簡介

《PyTorch語音識別實戰》使用PyTorch 2.0作為語音識別的基本框架，循序漸進地引導讀者從搭建環境開始，逐步深入到語音識別基本理論、算法以及套用實踐，是較好的一本語音識別技術圖書。本書配套示例源碼、數據集、PPT課件等資源。

《PyTorch語音識別實戰》分為13章，內容包括語音識別之路、PyTorch 2.0深度學習環境搭建、音頻信號處理的理論與Python實戰、音頻處理常用工具包Librosa詳解與實戰、基於DNN的語音情緒分類識別、一學就會的深度學習基礎算法、基於PyTorch卷積層的語音情緒分類識別、詞映射與循環神經網路、基於Whisper的語音轉換實戰、注意力機制與注意力模型詳解、鳥叫的多標籤分類實戰、多模態語音轉換模型基礎、GLM架構多模態語音文字轉換實戰。

《PyTorch語音識別實戰》內容詳盡、示例豐富，適合作為語音識別初學者、深度學習初學者、語音識別技術人員的必備參考書，同時也非常適合作為高等院校或高職高專深度學習、語音識別等課程的教材。

作者簡介

王曉華，高校計算機專業講師，研究方向為雲計算、大數據與人工智慧。其創作的部分圖書：《從零開始大模型開發與微調：基於PyTorch與ChatGLM》《PyTorch 2.0深度學習從零開始學》《Python機器學習與可視化分析實戰》《谷歌JAX深度學習從零開始學》《Spark 3.0大數據分析與挖掘：基於機器學習》《TensorFlow深度學習套用實踐》《TensorFlow語音識別實戰》《TensorFlow 2.0深度學習從零開始學》《深度學習的數學原理與實現》。

圖書目錄

第1章語音識別之路 1

1.1 何謂語音識別 1

1.2 語音識別為什麼那么難 2

1.3 語音識別之路—語音識別的發展歷程 3

1.3.1 高斯混合-隱馬爾科夫時代 4

1.3.2 深度神經網路-隱馬爾科夫時代 5

1.3.3 基於深度學習的端到端語音識別時代 6

1.3.4 多模態架構的語音識別與轉換 7

1.4 基於深度學習的語音識別的未來 8

1.5 本章小結 8

第2章 PyTorch 2.0深度學習環境搭建 9

2.1 環境搭建1：安裝Python 9

2.1.1 Miniconda的下載與安裝 9

2.1.2 PyCharm的下載與安裝 12

2.1.3 Python代碼小練習：計算softmax函式 15

2.2 環境搭建2：安裝PyTorch 2.0 16

PyTorch語音識別實戰

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條