用戶自適應的社會標籤生成和最佳化模型研究

用戶自適應的社會標籤生成和最佳化模型研究

《用戶自適應的社會標籤生成和最佳化模型研究》是依託武漢大學,由朱福喜擔任項目負責人的面上項目。

基本介紹

  • 中文名:用戶自適應的社會標籤生成和最佳化模型研究
  • 項目類別:面上項目
  • 項目負責人:朱福喜
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

標籤是Web 2.0下用戶標註網路信息資源的重要手段,應準確地體現用戶對資源的高度理解。本項目旨在研究用戶自適應的社會標籤生成和最佳化模型,以便能夠對特定網頁生成最合適當前用戶背景的標籤。為此,擬從以下幾個方面展開研究:首先,建立一定規模的用戶標註語料庫,並設計和訓練機率生成模型來模擬用戶對特定文檔的標註過程,以此推導出用戶對標籤的偏好程度,該模型還將考慮時態因素,以反映用戶的實時興趣;然後,對新網頁標註時,藉助維基百科和訓練集進行對網頁擴展,生成標籤樹,再利用訓練好的生成模型獲取用戶對標籤的偏好程度,並綜合考慮用戶的偏好度、標籤之間的冗餘度以及主題的覆蓋度,採用多目標最佳化技術產生一組理想的標籤;最後,考慮到標籤的自適應性,反饋機制也納入模型研究之中。本項目的研究對於提高Web信息檢索質量,捕獲Web信息中的熱點話題以及套用到計算廣告學中提高網頁、用戶和廣告三者的精確匹配都有著重要意義。

結題摘要

社會標籤對於信息資源的有效組織和管理、信息的快速傳播和共享及用戶及時獲取更加準確可靠的信息都有重要意義。本項目圍繞用戶自適應的社會標籤(簡稱標籤)生成和最佳化模型展開研究,從標籤抽取、用戶內容聯合標註模型、基於標籤的用戶興趣社區挖掘、基於標籤推的薦模型研究、社會標籤的套用研究五個方面入手,具體研究了標籤抽取和標籤模型的建立、基於用戶-內容聯合的標註模型、基於LDA的標籤推薦時序演化模型、基於標籤的複雜網路的社區挖掘、基於標籤傳播的推薦模型、基於屬性提升與偏好集成的上下文感知推薦研究、基於情感標籤的情感分類、基於情感標籤的銷量預測模型、基於人口屬性標籤和興趣標籤構建人群定向模型等科學問題。 本項目通過對標籤抽取和標註模型的研究,使得對於某個文檔,針對不同的閱讀用戶,該模型將產生既能刻畫網頁的主要內容,又能匹配用戶背景和可能興趣的標籤;通過挖掘複雜網路的社區結構,發現網路數據中隱含的知識信息,分析複雜網路數據的潛在規律和事物的本質特性,可以利用這些信息來指導社會、經濟和商業等方面的決策,本項目提出的效率高、準確度高的社區發現算法,能夠線上地、實時地挖掘出網路的社區結構,可廣泛套用於線上的好友推薦、人物分析和商業廣告精準投放等;通過基於標籤的推薦模型的研究,挖掘上下文推薦中豐富的屬性信息,對屬性進行精確地建模,設計出一種偏好集成方法把屬性提升得到的用戶興趣進行合理地整合,提升了表達用戶偏好的能力,最終達到多角度反映用戶偏好的目的,這種方法可以套用於推薦引擎的離線訓練,對解決實際系統的推薦任務是有深遠意義的;本項目在標籤模型的套用方面,主要通過挖掘文本資源中的標籤來提高複雜文本的情感分類,並通過用戶的各種標籤來研究人群的偏好,提出基於用戶各種標籤(如人口屬性,興趣類別等)的方法來提高人群推薦的質量,使推薦人群在廣告投放中能夠獲取到較好的投放效果。

相關詞條

熱門詞條

聯絡我們