社會化標籤的語義檢索研究

社會化標籤的語義檢索研究

《社會化標籤的語義檢索研究》主要講述了,社會化標註系統已發展成為重要的網路資源組織與共享平台,是Web2.0以來網路服務的重要發展方向之一。《社會化標籤的語義檢索研究》鑒於絕大多數用戶的標註行為符合社會共同認識,存在基本的、潛在的語義結構支配標籤的出現和資源語義構成,結合潛在語義分析這一信息檢索代數模型,提出基於潛在語義分析的標籤語義檢索模型和排序算法,來解決由於標籤的模糊性、不規範及資源數據龐大等造成的漏檢、低效率等問題。 《社會化標籤的語義檢索研究》在大量真實數據集上進行了實驗研究,驗證了方案的實用性與可行性,可作為系統開發者、信息研究者、網路服務提供者、信息管理者、高等院校師生及相關人員學習、研究的參考書。

基本介紹

  • 書名:社會化標籤的語義檢索研究
  • 出版社:東南大學出版社
  • 頁數:159頁
  • 開本:16
  • 品牌:南京東南大學出版社
  • 作者:宜云乾
  • 出版日期:2013年9月1日
  • 語種:簡體中文
  • ISBN:9787564144531
內容簡介,圖書目錄,

內容簡介

《社會化標籤的語義檢索研究》以社會化標註系統為例,針對以上的檢索弊端,對傳統檢索算法進行改進,提出基於潛在語義分析的標籤語義檢索模型,將潛在語義分析技術套用於社會化標註系統的語義分析中,構建基於向量的多維空間語義模型。改進傳統T—R矩陣的權重計算方法,提出資源全局權重和標籤全局權重的概念及計算公式,將局部權重(某個標籤在某個資源中的權重)、標籤全局權重(標籤在所有資源中的權重)以及資源全局權重(資源對標籤權重所能提供的信息量)相結合對權重計算進行改進,更貼切地反映了標籤標註頻數在標註系統權重計算中的作用,得到新的資源模型。
《社會化標籤的語義檢索研究》還結合尋找標註用戶相似性和資源標註的時序特性,對檢索排序算法進行改進,提出排序算法模型,讓越貼近的結果越在前面顯示。最後通過大量數據集合的實驗,驗證新方案的實用性有效性

圖書目錄

1緒論
1.1研究背景及意義
1.2研究現狀
1.2.1社會化標註系統研究
1.2.2社會化標註系統中標籤的語義標註研究
1.2.3社會化標註系統中檢索的排序算法研究
1.3研究範圍界定與思路
1.3.1研究範圍的界定
1.3.2基本假設
1.3.3研究思路
1.4研究內容安排與創新點
1.4.1研究內容安排
1.4.2創新點
1.5本章小結
2社會化標註系統標籤語義檢索模型研究
2.1社會化標註介紹
2.1.1社會化標註的發展歷程
2.1.2社會化標註的定義與系統模型
2.1.3社會化標註系統要素分析
2.1.4社會化標註系統標籤檢索的不足
2.2潛在語義分析簡介
2.2.1潛在語義分析概述
2.2.2潛在語義分析的數學依據
2.3基於潛在語義分析的標籤語義檢索
2.3.1語義檢索
2.3.2基於潛在語義分析的標籤語義檢索模型
2.4本章小結
3基於LSA的社會化標註系統語義標註研究
3.1傳統資源模型
3.2改進資源模型
3.2.1標註頻數與局部權重
3.2.2條件熵與標籤全局權重
3.2.3互信息與資源全局權重
3.3矩陣生成與奇異值分解
3.4語義空間更新
3.5本章小結
4社會化標註系統標籤語義檢索相似度計算與排序研究
4.1相似度計算比較分析與改進
4.2排序算法介紹
4.2.1PageRank算法
4.2.2HITS算法
4.2.3基於檢索用戶排序算法
4.2.4FolkRank算法
4.2.5GRank算法
4.2.6GFolkRank算法
4.2.7SocialSimRank算法
4.2.8SocialPageRank算法
4.3排序算法改進
4.3.1利用相似用戶來修正排序
4.3.2考慮時序特性來修正排序
4.3.3相似度計算修正
4.4本章小結
5社會化標註系統標籤語義檢索實證研究——以delicious.com為例
5.1數據獲取與實驗
5.2分析與評價
5.3中文標籤的檢索
5.4本章小結
6總結與展望
6.1總結
6.2展望
附錄A抓取的部分原始數據
附錄B整理出的數據
附錄C資源標註頻次數據
附錄D標籤標註頻次數據
附錄E資源與資原始碼
附錄F奇異值分解後的T,S,D矩陣
附錄G基於LSA的餘弦相似度修正計算排序結果
附錄H基於VSM的餘弦相似度計算結果
附錄I與檢索提問式相關的52個核心資源
附錄J基於LSA的查全率計算結果
附錄K基於VSM的查全率計算結果
附錄L基於LSA的查準率計算結果
附錄M基於VSM的查準率計算結果
參考文獻

相關詞條

熱門詞條

聯絡我們