文本語義相似度計算

內容簡介

本書基於領域本體信息，從概念、語句和文檔三個對象層面研究文本數據的語義相似度計算問題。詳細描述了語義提取、語義描述、語義計算三方面內容。包括概念相似度/相關度計算方法；語句相似度計算方法；文檔相似度計算方法以及基於語義的領域搜尋引擎的索引、排序技術等。書後還附有作者提供的計算數據，以便幫助讀者更好地閱讀使用本書。

目錄信息

第1 章緒論

1.1 國內外研究現狀及分析 / 1

1.1.1 國內外研究現狀 / 1

1.1.2 國內外研究分析 / 5

1.2 本書的主要研究工作與創新點 / 6

1.2.1 本書主要研究工作 / 6

1.2.2 本書創新點 / 7

第2 章概念相似度/相關度計算方法

2.1 概念相似度計算中的本體和語料庫 / 9

2.1.1 WordNet 本體簡介 / 9

2.1.2 語料庫簡介 / 24

2.2 概念相似度和相關度關係 / 25

2.3 概念語義相似度計算的既有研究成果 / 26

2.4 本體的樹結構（HCT）和圖結構（HCG） / 32

2.4.1 HCT 和HCG / 32

2.4.2 WordNet 中的HCT 和HCG 結構 / 32

2.4.3 HCT 和HCG 結構中影響語義相似度和相關度

的因素 / 33

2.5 基於HCT 本體結構的語義相似度 / 36

2.5.1 方法起源 / 36

2.5.2 概念相似度計算的相關定義 / 38

2.5.3 概念節點密度和相關概念節點對相似度計算

的影響 / 40

2.5.4 概念相似度計算 / 44

2.6 基於HCG 本體結構的語義相關度 / 45

2.6.1 HCT 結構和HCG 結構的關係 / 45

2.6.2 HCG 中的整體/ 部分關係的分類 / 46

2.6.3 將HCG 轉換為HCT 的方法 / 51

2.7 案例分析 / 53

2.7.1 案例1 利用某大學信息學院本體來計算概念

相關度 / 53

2.7.2 案例2 WordNet 本體 / 58

2.8 小結 / 66

第3章語句相似度計算方法

3.1 語句相似度計算簡介 / 68

3.2 語句相似度計算的既有研究成果 / 68

3.3 基於本體的語句相似度計算方法 / 69

3.3.1 語句相似度計算相關定義 / 69

3.3.2 基於HCT 本體結構的語句相似度計算方法 / 71

文本語義相似度計算

基本介紹

內容簡介

目錄信息

相關詞條

熱門詞條