Lucene套用開發揭秘

Lucene套用開發揭秘

《Lucene套用開發揭秘》不局限於如何使用Lucene,而是以Lucene為實例,通過對各模組的深入解析介紹搜尋引擎各個模組的設計原理與實現,進而能夠跳出Lucene看到搜尋引擎系統的架構全貌以及設計思想。最後,本課程會介紹在使用Lucene構建搜尋引擎系統的時候可能涉及的一些Lucene的高級特性以及個性化修改和干預,並最終給出基於Lucene的實時搜尋系統的實現實例。

基本介紹

  • 中文名:Lucene套用開發揭秘
  • 講    師:覺先 
  • 集    數: 24
  • ISRC:CN-M10-10-305-84/V.T
基本信息,作者介紹,課程目錄,

基本信息

出版社:機械工業出版社
發行商:華章培訓網

作者介紹

覺先,部落格園,csdn,ITeye知名博主,曾在諾基亞,EMC,賽門鐵克,百度,惠普等多家外企工作,長期從事搜尋引擎,雲計算方面的開發研究工作,對於lucene, hadoop, solr, nutch, zoie, sensei等搜尋引擎開源框架有深入研究,撰寫的博文《Lucene原理與代碼分析》系列在網上得到了廣泛好評。

課程目錄

1.第一講 搜尋引擎全貌
1.1.搜尋引擎系統的歷史
1.2.搜尋引擎系統的行業狀態
1.3.搜尋引擎系統的總體架構
1.4.初識Lucene
2.第二講 全文檢索的基本原理
2.1.什麼是全文檢索
2.2.索引裡面存了些什麼
2.3.如何創建索引
2.4.如何找到相關的文章
2.5.自己動手寫一個簡單的Lucene
3.第三講 自己動手實現一個簡單的Lucene
3.1.回顧全文檢索的重要過程
3.2.設計你的索引
3.3.如何創建索引
3.4.如何找到相關的文章
4.第四講 進入搜尋引擎的世界-設計你的索引格式
4.1.詞典的存儲方式
順序列表
指針列表
前端編碼
哈希表及最小完美哈希
Trie樹及雙數組Trie樹
M路搜尋樹
4.2.倒排表的存儲方式
定長編碼
差值編碼
無參數及有參數變長編碼
跳躍表
5.第五講 進入搜尋引擎的世界-Lucene的索引格式
5.1.基本概念
5.2.基本數據類型
5.3.一些基本規則
前綴編碼規則
差值規則
或然跟隨規則
跳躍表規則
5.4.重要的正向信息
5.5.重要的反向信息
5.6.其他信息
6.第六講 進入搜尋引擎的世界-索引的創建
6.1.索引創建的主要過程
6.2.基於記憶體的索引創建
6.3.基於硬碟的索引創建
6.4.動態索引的創建
6.5.索引的合併
7.第七講 進入搜尋引擎的世界-Lucene的索引的創建
7.1.索引過程的總體架構
7.2.Lucene的多執行緒索引
7.3.Lucene的多域索引
7.4.索引創建的關鍵步驟
7.5.Lucene的文檔刪除
7.6.Lucene的快取管理
8.第八講 進入搜尋引擎的世界-Lucene的索引合併
8.1.Lucene段的合併綜述
8.2.段的合併策略
8.3.反向信息的合併
8.4.段合併的關鍵步驟
9.第九講 進入搜尋引擎的世界-搜尋的過程
9.1.搜尋的主要過程
9.2.查詢預處理
Stemming
拼寫檢查
同義詞
查詢擴展
9.3.信息檢索模型
基於集合論:布爾模型
基於代數論:向量空間模型
基於機率論:語言模型
10.第十講 進入搜尋引擎的世界-Lucene的搜尋過程
10.1.搜尋過程的總體架構
10.2.Lucene的查詢語法
10.3.Lucene的評分機制
10.4.Lucene搜尋的關鍵步驟
11.第十一講 進入搜尋引擎的世界-Lucene的幾種重要查詢
11.1.查詢對象的層次結構
11.2.幾種高級的查詢對象
RangeQuery, SpanQuery, FilterQuery
12.第十二講 進入搜尋引擎的世界-分詞
12.1.常用的分詞方法
基於詞典的機械切分算法:最大匹配方法,最短路徑方法
基於統計的切分算法:N元語法
12.2.Lucene中的分詞器
12.3.定製自己的分詞器
對中科院分詞進行封裝
13.第十三講 Lucene的高級特性之一
13.1.Payload的原理與套用
13.2.區間查詢及使用Payload實現區間查詢
13.3.按照域Field進行排序及使用Payload實現按欄位排序
13.4.Lucene的事務性
14.第十四講 Lucene的高級特性之二
14.1.Lucene的性能瓶頸
14.2.影響Lucene的評分過程的四種方式
15.第十五講 基於Lucene的實時搜尋的原理與實現
15.1.實時搜尋的原理
15.2.實時搜尋的實現及代碼
16.第十六講 基於Lucene的實時搜尋中文檔更新問題
16.1.實時搜尋中文檔更新原理
16.2.實時搜尋中文檔更新實現及代碼
17.第十七講 實時搜尋系統框架Zoie
17.1.總體架構
17.2.配置一個Zoie
17.3.Zoie實現實時搜尋的原理
17.4.Zoie的索引過程
17.5.Zoie的搜尋過程
18.第十八講 基於Zoie創建實時搜尋系統
18.1.運行Zoie的一個Demo
18.2.總體架構
18.3.實現自己的各個組件
索引組件代碼實現
搜尋組件代碼實現
實時搜尋系統Demo
19.第十九講 分散式搜尋框架Sensei
19.1.總體架構
19.2.詳細架構
19.3.配置Sensei伺服器端
19.4.配置Sensei客戶端
19.5.Sensei的重要過程
客戶端啟動過程
伺服器端啟動過程
客戶端搜尋過程
伺服器端搜尋過程
20.第二十講 基於sensei創建分散式搜尋系統
20.1.總體架構
20.2.實現自己的各個組件
伺服器端代碼實現
客戶端代碼實現
分散式搜尋系統Demo

相關詞條

熱門詞條

聯絡我們