基於潛在出行主題模型的民航旅客大數據挖掘與分析

《基於潛在出行主題模型的民航旅客大數據挖掘與分析》是依託南開大學,由劉傑擔任項目負責人的聯合基金項目。

基本介紹

  • 中文名:基於潛在出行主題模型的民航旅客大數據挖掘與分析
  • 項目類別:聯合基金項目
  • 項目負責人:劉傑
  • 依託單位:南開大學
中文摘要,結題摘要,

中文摘要

在高速發展、競爭激烈的民航產業中,理解旅客的出行需求,實現精準行銷具有重要意義。然而,傳統客戶類別劃分等方法無法有效的刻畫和建模旅客個性化的出行偏好。針對此問題,本課題以挖掘民航旅客出行大數據切入點,展開以下幾方面研究:(1)創新性地提出潛在出行主題模型來建模旅客多種出行偏好的潛在機率分布;(2)提出基於貝葉斯統一框架的異質信息網路多因素建模方法,綜合考慮航線熱度,旅客忠誠度,市場占有率,客戶身份等複雜因素;(3)針對民航數據的大規模、稀疏特性,提出了一種融入社交計算思想的隱式出行主題圖模型的建模方法,並建立針對大規模數據的並行化建模算法。在這些研究的基礎上,本課題研究結合民航旅客出行的真實套用場景,提供個性化的出行推薦,客戶細分,地區細分等服務。研究成果將極大地推進旅客行為建模在民航等行業大數據中的套用, 是對相關套用和機器學習理論的重要探索和擴展,具有重要的理論價值和廣泛的套用前景。

結題摘要

旅客出行需求的理解對民用航空公司而言是非常重要的,分析旅客出行行為對機票代理、機場規劃、旅遊相關行業、地區經濟活動分析管理等社會經濟活動具有重大價值。項目組以大規模民航出行數據為研究對象,主要研究內容如下:首先通過統計分析方法分析旅客出行特點和行為模式,尋找影響旅客出行行為的因素,並進行合理劃分,構建了考慮多種影響因素的旅客出行行為模型;其次,創新性地提出潛在出行主題模型來建模旅客多種出行偏好的潛在機率分布,為了解決數據稀疏性問題,引入旅客關聯圖,構建社交關係出行主題模型;最後,引入地區對旅客出行行為的影響,構建面向地區的潛在出行主題模型和面向地區的社交關係出行主題模型,並提出多因素旅遊預測框架和相關的並行挖掘算法。項目組採用預測旅客選擇航線的任務進行實驗,數據集採用真實的不同地區的民航旅客出行記錄,實驗結果顯示面向地區的潛在出行主題模型比傳統的推薦方法性能更好,並且對於出行頻次更低的旅客,社交關係出行主題模型表現出更優的性能,這說明了引入旅客關聯圖能有效解決數據的稀疏性問題。本課題的研究成果將推動相關的民航旅客出行數據挖掘與分析方法在實際中的套用,所提出的相關理論和方法可廣泛用於其他交通,社會經濟的大數據挖掘中,具有重要的套用價值、商業價值和社會價值。

相關詞條

熱門詞條

聯絡我們