智慧型搜尋:大數據搜尋引擎原理及算法解析

智慧型搜尋:大數據搜尋引擎原理及算法解析

《智慧型搜尋:大數據搜尋引擎原理及算法解析》是2019年11月1日清華大學出版社出版的圖書,作者是沙芸。

基本介紹

  • 書名:智慧型搜尋:大數據搜尋引擎原理及算法解析
  • 作者:沙芸
  • ISBN:9787302535508 
  • 定價:69.80元 
  • 出版社清華大學出版社 
  • 出版時間:2019年11月1日 
  • 印次:1-1
  • 印刷日期:2019.09.03 
內容簡介,目錄,

內容簡介

《智慧型搜尋:大數據搜尋引擎原理及算法解析》介紹大數據分散式搜尋引擎開發原理與技術實現,主要內容包括多種語言的文本處理、分散式算法與代碼實現、Elasticsearch的使用與原理等,通過一個醫藥領域垂直搜尋引擎和電商搜尋來說明如何開發實際的大數據智慧型搜尋引擎。《智慧型搜尋:大數據搜尋引擎原理及算法解析》共分6章,第1章著重介紹開發智慧型搜尋引擎可以採用的軟硬體環境;第2~5章著重討論構建分散式智慧型搜尋引擎可能需要的多種語言文本處理方法,例如Kaldi語音識別實現和基於Raft共識協定的分散式計算平台實現;第6章介紹醫藥和電商搜尋兩個套用案例。 《智慧型搜尋:大數據搜尋引擎原理及算法解析》適合作為高等院校計算機、軟體工程專業本科生、研究生的參考用書,對於對人工智慧領域感興趣的人士也有一定的參考價值。

目錄

第1章 智慧型搜尋引擎開發 1
1.1 人工智慧與智慧型搜尋引擎 1
1.2 Linux作業系統基礎 2
1.2.1 SSH遠程登錄 2
1.2.2 Micro文本編輯器 4
1.2.3 Linux Shell腳本基礎 4
1.2.4 Shell腳本 5
1.2.5 AWK 8
1.3.1 使用Ant 9
1.3.2 使用Maven 11
1.3.3 使用Gradle 13
1.3.4 使用Groovy Shell 16
1.3.5 使用JShell 17
1.4 Python基礎 17
1.4.1 Windows下安裝Python 17
1.4.2 Linux下安裝Python 17
1.4.3 開發環境 18
1.5 C#基礎 19
1.6 硬體基礎 21
1.7 本章小結 22
第2章 搜尋引擎理解語義 23
2.1 處理文本 23
2.2 基於文法的語言模型 24
2.3 正則表達式查找文本 25
2.4 中文詞語切分與詞性標註 27
2.4.1 使用中文分詞 28
2.4.2 正向最大長度匹配法 30
2.4.3 未登錄串識別 31
2.4.4 基本的N元模型 34
2.5.1 數據基礎 43
2.6 英文文本切分與標註 48
2.6.1 句子切分 48
2.6.2 標註詞性 50
2.7.1 人名識別 52
2.7.2 人名識別規則 53
2.8文本歸一化 61
2.9依存樹模型 62
2.10情感分析 63
2.11本章小結 66
第3章搜尋引擎聽懂語音 67
3.1語音識別總體結構 67
3.2Kaldi快速入門 68
3.2.1安裝Kaldi 69
3.2.2yesno例子 69
3.2.3數據準備 70
3.2.4詞典準備 71
3.2.5構建一個簡單的ASR 74
3.3使用FFmpeg提取音頻 82
3.4時間序列 82
3.6傅立葉變換 86
3.7MFCC特徵 92
3.8線上解碼 93
3.8.1使用現成的模型 93
3.8.2使用Alex-ASR 94
3.9加權有限狀態轉換 95
3.9.1FSA 96
3.9.2FST 97
3.9.3WFST 98
3.10語音識別語料庫 99
3.10.1TIMIT語音庫 99
3.10.2中文語音庫 99
3.11本章小結 100
第4章Elasticsearch分散式搜尋引擎 101
4.1搭建Elasticsearch集群 101
4.2索引數據 103
4.3實現搜尋接口 107
4.4搜尋界面開發 108
4.4.1使用SpringBoot開發搜尋界面 109
4.4.2使用.NET開發搜尋界面 132
4.5檢索模型 142
4.5.1使用BM25檢索模型 146
4.5.2參數調優 146
4.6搜尋中文最佳化 147
4.7Elasticsearch原始碼分析 152
4.7.1導入原始碼到Eclipse 152
4.7.2Guice框架 152
4.7.3Netty異步IO框架 154
4.7.4分散式設計與實現 155
4.7.5使用Lucene 156
4.8本章小結 159
第5章分散式計算平台 160
5.1Atomix框架 160
5.1.1Raft協定 160
5.1.2使用Atomix 162
5.2gRPC框架 164
5.3本章小結 167
第6章智慧型搜尋案例分析 168
6.1醫藥垂直搜尋引擎 168
6.1.1網路爬蟲 169
6.1.2抓取PubMed 177
6.1.3MVC搜尋界面開發 179
6.1.4構建知識庫 183
6.1.5自動問答 185
6.2電商搜尋 188
6.2.1電商爬蟲 188
6.2.2商品搜尋 192
6.2.3線上客服 195
6.3本章小結 198
參考文獻 199

相關詞條

熱門詞條

聯絡我們