社會化標籤的語義檢索研究

內容簡介

《社會化標籤的語義檢索研究》以社會化標註系統為例，針對以上的檢索弊端，對傳統檢索算法進行改進，提出基於潛在語義分析的標籤語義檢索模型，將潛在語義分析技術套用於社會化標註系統的語義分析中，構建基於向量的多維空間語義模型。改進傳統T—R矩陣的權重計算方法，提出資源全局權重和標籤全局權重的概念及計算公式，將局部權重（某個標籤在某個資源中的權重）、標籤全局權重（標籤在所有資源中的權重）以及資源全局權重（資源對標籤權重所能提供的信息量）相結合對權重計算進行改進，更貼切地反映了標籤標註頻數在標註系統權重計算中的作用，得到新的資源模型。
《社會化標籤的語義檢索研究》還結合尋找標註用戶相似性和資源標註的時序特性，對檢索排序算法進行改進，提出排序算法模型，讓越貼近的結果越在前面顯示。最後通過大量數據集合的實驗，驗證新方案的實用性和有效性。

圖書目錄

1緒論
1.1研究背景及意義
1.2研究現狀
1.2.1社會化標註系統研究
1.2.2社會化標註系統中標籤的語義標註研究
1.2.3社會化標註系統中檢索的排序算法研究
1.3研究範圍界定與思路
1.3.1研究範圍的界定
1.3.2基本假設
1.3.3研究思路
1.4研究內容安排與創新點
1.4.1研究內容安排
1.4.2創新點
1.5本章小結
2社會化標註系統標籤語義檢索模型研究
2.1社會化標註介紹
2.1.1社會化標註的發展歷程
2.1.2社會化標註的定義與系統模型
2.1.3社會化標註系統要素分析
2.1.4社會化標註系統標籤檢索的不足
2.2潛在語義分析簡介
2.2.1潛在語義分析概述
2.2.2潛在語義分析的數學依據
2.3基於潛在語義分析的標籤語義檢索
2.3.1語義檢索
2.3.2基於潛在語義分析的標籤語義檢索模型
2.4本章小結
3基於LSA的社會化標註系統語義標註研究
3.1傳統資源模型
3.2改進資源模型
3.2.1標註頻數與局部權重
3.2.2條件熵與標籤全局權重
3.2.3互信息與資源全局權重
3.3矩陣生成與奇異值分解
3.4語義空間更新
3.5本章小結
4社會化標註系統標籤語義檢索相似度計算與排序研究
4.1相似度計算比較分析與改進
4.2排序算法介紹
4.2.1PageRank算法
4.2.2HITS算法
4.2.3基於檢索用戶排序算法
4.2.4FolkRank算法
4.2.5GRank算法
4.2.6GFolkRank算法
4.2.7SocialSimRank算法
4.2.8SocialPageRank算法
4.3排序算法改進
4.3.1利用相似用戶來修正排序
4.3.2考慮時序特性來修正排序
4.3.3相似度計算修正
4.4本章小結
5社會化標註系統標籤語義檢索實證研究——以delicious.com為例
5.1數據獲取與實驗
5.2分析與評價
5.3中文標籤的檢索
5.4本章小結
6總結與展望
6.1總結
6.2展望
附錄A抓取的部分原始數據
附錄B整理出的數據
附錄C資源標註頻次數據
附錄D標籤標註頻次數據
附錄E資源與資原始碼
附錄F奇異值分解後的T，S，D矩陣
附錄G基於LSA的餘弦相似度修正計算排序結果
附錄H基於VSM的餘弦相似度計算結果
附錄I與檢索提問式相關的52個核心資源
附錄J基於LSA的查全率計算結果
附錄K基於VSM的查全率計算結果
附錄L基於LSA的查準率計算結果
附錄M基於VSM的查準率計算結果
參考文獻

社會化標籤的語義檢索研究

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條