Solr 實戰

Solr 實戰

《Solr 實戰》一書原作者Trey Grainger(崔.格蘭傑)、Timothy Potter(提摩斯.波特),中文版由范煒 等譯,電子工業出版社2017年5月出版

基本介紹

  • 書名:Solr 實戰
  • 作者:【美】Trey Grainger(崔.格蘭傑) 【美】Timothy Potter(提摩斯.波特)
  • 譯者:范煒 等
  • ISBN:978-7-121-31165-9
  • 頁數:632
  • 定價:129.00
  • 出版社:電子工業出版社
  • 出版時間:2017年5月
  • 開本:16
內容提要,目錄,

內容提要

《Solr實戰》介紹了當下最流行的開源搜尋技術解決方案Solr。在搜尋引擎視域下,循序漸進地介紹了Solr是什麼、Solr能做什麼,以及如何更好地使用Solr進行開發。在搜尋基礎層,《Solr實戰》從Solr的快速搭建入手,介紹了Solr背後的信息檢索基本概念,之後重點講解了構建一個搜尋引擎所需的核心模組:索引構建、文本分析、執行搜尋及處理搜尋結果。在搜尋功能層,詳細介紹了Solr的四大增強型搜尋功能:分面搜尋、搜尋結果高亮、查詢建議、搜尋結果分組等。在搜尋研究的進階層,介紹了SolrCloud、多語種搜尋及複雜查詢操作等。最後,圍繞搜尋引擎的本質核心問題“相關度”展開了討論與展望。
《Solr實戰》適合搜尋技術工程師、搜尋套用設計者以及對搜尋引擎技術感興趣的讀者閱讀,也可作為高校計算機專業信息技術方向、信息管理與信息系統專業等的課程參考資料。

目錄

第 1部分 初識 Solr. 1
1 Solr入門 2
1.1 為什麼需要搜尋引擎 3
1.2 Solr是什麼. 8
1.3 選擇 Solr的理由 15
1.4 功能概述 17
1.5 本章小結 22
2 Solr上手.23
2.1 開始上手 24
2.2 一切都關乎搜尋 31
2.3 Solr管理控制台一覽. 40
2.4 根據需求改造搜尋示例伺服器 42
2.5 本章小結 43
3 Solr基礎理論 45
3.1 搜尋、匹配與找尋內容 46
3.2 相關度 61
3.3 查準率與查全率 67
3.4 搜尋的規模化 70
3.5 本章小結 75
4 配置 Solr.77
4.1 solrconfi.xml檔案概覽 80
4.2 查詢請求處理 85
4.3 管理搜尋器 98
4.4 快取管理 103
4.5 其他配置選項 110
4.6 本章小結111
5 創建索引112
5.1 微博搜尋套用示例 113
5.2 設計自己的 schema 117
5.3 在 schema.xml中定義欄位 121
5.4 結構化非文本欄位類型 129
5.5 傳送文檔到 Solr進行索引 137
5.6 更新處理器 143
5.7 索引管理 151
5.8 本章小結 156
6 文本分析157
6.1 微博文本分析 158
6.2 基礎文本分析 161
6.3 為微博文本自定義一個欄位類型 169
6.4 高級文本分析 182
6.5 本章小結 188
第 2部分 Solr的核心功能 191
7 執行查詢和處理搜尋結果. 192
7.1 Solr請求詳解 193
7.2 查詢解析器的使用 201
7.3 查詢和過濾器 204
7.4 默認查詢分析器(Lucene查詢解析器). 209
7.5 處理用戶查詢(eDisMax查詢解析器) 215
7.6 其他有用的查詢解析器 225
7.7 返回搜尋結果 231
7.8 搜尋結果排序 237
7.9 調試查詢結果 240
7.10 本章小結 241
8 分面搜尋242
8.1 搜尋結果概覽 243
8.2 建立測試數據 246
8.3 欄位分面 250
8.4 查詢分面 255
8.5 區間分面 257
8.6 基於分面值的過濾 260
8.7 多選分面、鍵與標記 266
8.8 超越分面基礎 271
8.9 本章小結 271
9 搜尋結果高亮272
9.1 高亮簡介 273
9.2 高亮工作原理 274
9.3 使用 FastVectorHighlighter組件提升性能. 292
9.4 PostingsHighlighter組件 293
9.5 本章小結 296
10 查詢建議 297
10.1 拼寫檢查 298
10.2 自動建議查詢詞 309
10.3 文檔欄位值建議 312
10.4 基於用戶活動提供查詢建議 315
10.5 本章小結 320
11 結果分組 /欄位摺疊321
11.1 結果分組 vs. 欄位摺疊 322
11.2 忽略重複文檔 322
11.3 搜尋結果中每組返回多個文檔 330
11.4 按照函式和查詢對結果分組 334
11.5 對分組結果進行分頁和排序 337
11.6 分組陷阱 340
11.7 使用摺疊查詢解析器進行高效的欄位摺疊 344
11.8 本章小結 346
12 搭建 Solr生產環境.347
12.1 編寫一份 Solr的分發版. 347
12.2 部署 Solr 348
12.3 硬體和伺服器配置 350
12.4 數據獲取策略 357
12.5 分片和複製 361
12.6 Solr核心管理 368
12.7 管理伺服器集群 374
12.8 Solr的查詢與互動. 378
12.9 監控 Solr的性能. 383
12.10 不同 Solr版本之間的升級. 391
12.11 本章小結 392
第 3部分 Solr進階.393
13 SolrCloud.394
13.1 SolrCloud上手. 395
13.2 核心概念 405
13.3 分散式索引 416
13.4 分散式搜尋 423
13.5 集合 API 425
13.6 基本系統管理任務 431
13.7 高級主題 435
13.8 本章小結 438
14 多語種搜尋 439
14.1 為什麼語種分析很重要 440
14.2 詞幹提取 vs.詞形還原 441
14.3 詞幹提取實戰 442
14.4 處理邊界情況 447
14.5 Solr支持的語種庫. 449
14.6 在多語種中搜尋內容 453
14.7 語種識別 475
14.8 本章小結 488
15 複雜查詢操作489
15.1 函式查詢 490
15.2 地理空間搜尋 507
15.3 分面透視 523
15.4 引用外部數據 526
15.5 跨文檔和跨索引的連線 528
15.6 使用 Solr做大數據分析. 531
15.7 本章小結 532
16 精通相關度 533
16.1 相關度調整的影響 534
16.2 相關度計算的調試 535
16.3 提升相關度 541
16.4 可插拔的相似度的類實現 552
16.5 個性化搜尋與推薦 553
16.6 塑造個性化搜尋體驗 574
16.7 開展相關度實驗 574
16.8 本章小結 577
附錄A 與 Solr代碼庫打交道 578
附錄B 語種欄位類型配置 587
附錄C 有用的數據導入配置 593

相關詞條

熱門詞條

聯絡我們