文本挖掘與信息檢索概論

《文本挖掘與信息檢索概論》是清華大學出版社於2022年出版的書籍,作者是蔡曉妍、楊黎斌、程塨、姚西文、姚超、韓軍偉

基本介紹

  • 書名:文本挖掘與信息檢索概論
  • 作者:蔡曉妍、楊黎斌、程塨、姚西文、姚超、韓軍偉
  • 出版社:清華大學出版社
  • 出版時間:2022年10月1日
  • 頁數:192 頁
  • 定價:49 元
  • 開本:16 開
  • 裝幀:平裝 
  • ISBN:9787302597445
內容簡介,目錄,

內容簡介

文本挖掘與信息檢索是近年來人工智慧領域的熱點研究方向。本書共8章,包括信息檢索概述、信息檢索模型、信息檢索的評價、文本分類技術、文本聚類技術、自動摘要技術、文本推薦技術和網頁連結分析,融合了統計學、機器學習、資料庫等知識,具有多學科交叉的特點。 內容全面,案例豐富,適合作為人工智慧、數據科學、計算機、軟體工程等專業的本科生和研究生教材,也可作為企事業單位相關研究人員的參考資料。

目錄

第1章信息檢索概述
1.1數據、信息和知識
1.1.1從數據到信息
1.1.2從信息到知識
1.2信息檢索的定義
1.3信息檢索的發展
1.3.1信息檢索的發展歷史
1.3.2信息檢索的主要方法
1.3.3信息檢索的套用
1.3.4信息檢索的發展趨勢
習題
第2章信息檢索模型
2.1概述
2.2向量空間檢索模型
2.2.1內積
2.2.2相似度計算
2.3機率檢索模型
2.3.1機率論基礎知識
2.3.2詞項權重
2.3.3二值獨立模型
2.3.4非二值獨立模型
2.4基於語言建模的信息檢索模型
2.4.1龐特模型
2.4.2零機率問題以及解決方法
2.4.3語言模型檢索框架
2.4.4跨語言檢索模型
習題
第3章信息檢索的評價
3.1信息檢索的評價指標
3.1.1查全率
3.1.2査準率
3.1.3查準率與查全率的關係
3.1.4漏檢率和誤檢率
3.1.5回響時間
3.2信息檢索系統的評價
習題
第4章文本分類技術
4.1概述
4.1.1基本概念
4.1.2文本自動分類的兩種類型
4.1.3文本分類模式
4.1.4文本分類過程
4.2文本預處理
4.2.1分詞技術
4.2.2停用詞去除
4.2.3文本特徵選擇方法
4.2.4文本表示方法

相關詞條

熱門詞條

聯絡我們