面向微博的地理興趣點抽取及其用戶行為意圖分析研究

面向微博的地理興趣點抽取及其用戶行為意圖分析研究

《面向微博的地理興趣點抽取及其用戶行為意圖分析研究》是依託武漢大學,由李晨亮擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向微博的地理興趣點抽取及其用戶行為意圖分析研究
  • 項目類別:青年科學基金項目
  • 項目負責人:李晨亮
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

微博實時的信息分享使得基於微博內容開展用戶位置研究變成一個重要研究內容,這類技術的發展對個性化地理服務、廣告行銷和智慧城市等領域提供了科學技術層面的支持。現有研究工作主要依賴於用戶的主動地理信息分享,由於其位置分析精細度較低並且用戶行為意圖信息不明,這些技術很難支撐上述套用。本課題旨在通過分析用戶微博內容,依次研究微博地理興趣點(POI)抽取算法, POI地理位置推斷算法和用戶關於POI的行為意圖分析算法,實現細粒度地獲知用戶的地理位置、活動計畫和內容的目標。項目將採用文本挖掘與自然語言處理相關技術理論,重點研究:(1)POI詞條的語義語境特徵的抽取、轉換和表征方法;(2)基於空間行為模式與空間主題分布的POI位置推斷方法;(3)用戶關於POI的時間趨勢特徵抽取與度量方法。本項研究對於推動文本處理技術的進一步發展以及滿足套用領域對用戶地理信息分析的需求,具有重要的科學意義和套用價值。

結題摘要

微博實時的信息分享使得基於微博內容開展用戶位置研究變成一個重要研究內容,這類技術的發展對個性化地理服務、廣告行銷和智慧城市等領域提供了科學技術層面的支持。現有研究工作主要依賴於用戶的主動地理信息分享,由於其位置分析精細度較低並且用戶行為意圖信息不明,這些技術很難支撐上述套用。本課題旨在通過分析用戶微博內容,依次研究微博地理興趣點(POI)抽取算法, POI地理位置推斷算法和用戶關於POI的行為意圖分析算法,實現細粒度地獲知用戶的地理位置、活動計畫和內容的目標。項目將採用文本挖掘與自然語言處理相關技術理論,重點研究:(1)POI詞條的語義語境特徵的抽取、轉換和表征方法;(2)基於空間行為模式與空間主題分布的POI位置推斷方法;(3)用戶關於POI的時間趨勢特徵抽取與度量方法。本項目經過三年的科學研究,在短文本的主題建模、微博文本POI的抽取及其用戶時間趨勢解析、和無監督和零樣本的文本分類與過濾三個方面取得了一系列的研究成果。項目結合深度學習詞向量表示,提出了一種利用波利亞罐子模型來緩解短文本單詞共生信息稀疏的短文本主題模型,並進一步提出了基於泊松分布的新短文本主題模型,通過引入自適應調節短文本主題個數,從而實現細粒度的短文本的主題建模效果。與此同時,項目研製了一種新的二階段的地理興趣點抽取及其用戶時間趨勢解析算法。該工作發現地理興趣點抽取與用戶時間趨勢解析兩個任務所涉及的特徵信息並不相同。地理興趣點的抽取主要涉及微博文本中地理興趣點的語境特點、語言學特徵和地理興趣點詞典特徵。然而,對於時間趨勢解析任務,其更多的涉及微博的語言學特徵與時間信息。在真實微博數據集上的測試表明,該工作提出的二階段算法顯著優於現有前沿算法。最後,項目就文本分類深入研究無監督的文本分類與基於深度學習的零樣本文本過濾技術,為POI相關語義語境特徵的獲取擴展了更多的思路和技術途徑。本項研究對於推動文本處理技術的進一步發展以及滿足套用領域對用戶地理信息分析的需求,具有重要的科學意義和套用價值。

相關詞條

熱門詞條

聯絡我們