XML個性化協作搜尋及其在社會網路服務中的套用

XML個性化協作搜尋及其在社會網路服務中的套用

《XML個性化協作搜尋及其在社會網路服務中的套用》是依託華東師範大學,由王曉玲擔任項目負責人的面上項目。

基本介紹

  • 中文名:XML個性化協作搜尋及其在社會網路服務中的套用
  • 項目類別:面上項目
  • 項目負責人:王曉玲
  • 依託單位:華東師範大學
項目摘要,結題摘要,

項目摘要

隨著Web2.0和Web3.0套用的迅猛發展,社會網路服務(包括微博、RSS和Facebook圖片共享等)發展迅速,普遍採用XML作為其數據交換的載體,導致網際網路套用中的XML信息內容增長迅速,傳統的Web搜尋引擎提供了對無結構的頁面數據的檢索,由於數據處理對象不同、查詢語義和查詢策略不同,很難支撐XML數據的個性化檢索。本課題以分析用戶網路瀏覽數據和社會網路關聯為依據,以圖模型為理論基礎,以XML數據的個性化搜尋服務為中心,探索基於圖的查詢聚類技術,深入研究相關的挖掘、存儲、索引、搜尋、排序、最佳化等技術,建立一個全面及綜合性的個性化搜尋架構。同時,為了提高系統性能,本課題還將深入探討協作搜尋策略。研究內容包括個性化的表示和建模技術、個性化檢索技術、協作檢索技術、用戶概念圖的存儲和索引技術、查新結果的打分和排序技術等關鍵技術。通過開發原型系統,建立示範性套用,為現實套用提供技術支撐。

結題摘要

本課題以用戶線上行為數據、用戶的社會網路關係等為分析依據,以用戶興趣分析與挖掘、個性化搜尋為中心,探索麵向個性化搜尋的查詢最佳化技術和社會化搜尋技術,深入研究相關的搜尋、排序、最佳化等技術,建立一個個性化搜尋架構,並探索在相關真實套用的實證研究。項目的主要成果包括: (1)個性化信息的建模和挖掘算法。要進行個性化推薦,首先需要建模用戶的興趣、概念、偏好等個性化信息。我們研究了基於熵的PU學習方法,該方法針對用戶點擊數據中負例少的特點,傳統數據挖掘方法不能直接用於這類PU數據,我們設計的該套方法發表在WWW Journal、APWEB等國際期刊和會議上。在用戶行為建模方面,本課題設計對用戶線上行為數據(包括評論數據、瀏覽點擊數據等)進行分析與挖掘的一系列的算法,包括主題分析模型、基於知識圖譜的用戶特徵分析、基於多分類器集成的觀點分析等,用來獲取用戶興趣,構建有效的用戶個性化特徵。相關研究成果發表在《計算機學報》、WWW、WISE等國內外重要學術期刊和學術會議上。 (2)建立了面向社會網路數據進行分析的框架,結合內容主題分析技術,確定用戶概要產生的社會子網路圖。基於此用戶社會網路開展的查詢和搜尋,更具有個性化和針對性的特點,提高了查詢結果的質量。相關研究成果發表在ICDE workshop、NDBC、DASFAA等數據管理領域的重要學術會議上。 (3)對於搜尋排序和最佳化技術,探索了基於次模理論的排序算法,不僅提高了搜尋的效率,而且從理論上保證了我們提出的排序方法的精度。相關研究成果發表在DASFAA、APWEB、《軟體學報》等重要學術刊物上。 (4)對於大規模分散式索引、查詢最佳化等關鍵技術,設計了分散式索引,用分散式樹簇代替傳統的集中式樹型索引;設計了3類最佳化方法,實現視窗函式的最佳化。相關研究成果發表在《計算機學報》、ICDE上。 (5)在上述理論和算法的基礎之上,實現了自適應的個性化搜尋的框架和核心算法,並在個性化酒店推薦、審稿論文分發等實際套用中進行了驗證,不僅申請了軟體著作權和專利,而且套用系統得到用戶的好評,個性化特徵明顯,搜尋質量高。

相關詞條

熱門詞條

聯絡我們