出版信息,內容介紹,目錄,
出版信息
智慧型搜尋:大數據搜尋引擎原理及算法解析
作者:沙芸
定價:69.80元
印次:1-1
ISBN:9787302535508
出版日期:2019.11.01
印刷日期:2019.09.03
定價:69.80元
印次:1-1
ISBN:9787302535508
出版日期:2019.11.01
印刷日期:2019.09.03
內容介紹
《智慧型搜尋:大數據搜尋引擎原理及算法解析》介紹大數據分散式搜尋引擎開發原理與技術實現,主要內容包括多種語言的文本處理、分散式算法與代碼實現、Elasticsearch的使用與原理等,通過一個醫藥領域垂直搜尋引擎和電商搜尋來說明如何開發實際的大數據智慧型搜尋引擎。《智慧型搜尋:大數據搜尋引擎原理及算法解析》共分6章,第1章著重介紹開發智慧型搜尋引擎可以採用的軟硬體環境;第2~5章著重討論構建分散式智慧型搜尋引擎可能需要的多種語言文本處理方法,例如Kaldi語音識別實現和基於Raft共識協定的分散式計算平台實現;第6章介紹醫藥和電商搜尋兩個套用案例。 《智慧型搜尋:大數據搜尋引擎原理及算法解析》適合作為高等院校計算機、軟體工程專業本科生、研究生的參考用書,對於對人工智慧領域感興趣的人士也有一定的參考價值。
目錄
第1章 智慧型搜尋引擎開發 1
1.1 人工智慧與智慧型搜尋引擎 1
1.2 Linux作業系統基礎 2
1.2.1 SSH遠程登錄 2
1.2.2 Micro文本編輯器 4
1.2.3 Linux Shell腳本基礎 4
1.2.4 Shell腳本 5
1.2.5 AWK 8
1.3 Java基礎 8
1.3.1 使用Ant 9
1.3.2 使用Maven 11
1.3.3 使用Gradle 13
1.3.4 使用Groovy Shell 16
1.3.5 使用JShell 17
1.4 Python基礎 17
1.4.1 Windows下安裝Python 17
1.4.2 Linux下安裝Python 17
1.4.3 開發環境 18
1.5 C#基礎 19
1.6 硬體基礎 21
1.7 本章小結 22
第2章 搜尋引擎理解語義 23
2.1 處理文本 23
2.2 基於文法的語言模型 24
2.3 正則表達式查找文本 25
2.4 中文詞語切分與詞性標註 27
2.4.1 使用中文分詞 28
2.4.2 正向最大長度匹配法 30
2.4.3 未登錄串識別 31
2.4.4 基本的N元模型 34
2.5 隱馬爾可夫模型 43
2.5.1 數據基礎 43
2.5.2 維特比算法 44
2.6 英文文本切分與標註 48
2.6.1 句子切分 48
2.6.2 標註詞性 50
2.7 命名實體識別 52
2.7.1 人名識別 52