《情緒因素對網路搜尋預測的影響研究:以旅遊市場為例》是依託中國科學院大學,由劉穎擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:情緒因素對網路搜尋預測的影響研究:以旅遊市場為例
- 項目類別:青年科學基金項目
- 項目負責人:劉穎
- 依託單位:中國科學院大學
項目摘要,結題摘要,
項目摘要
客流量預測是旅遊行銷和運營的重要環節,針對傳統預測模型難以捕獲當前市場最新動態的缺陷,近3年興起的基於網路搜尋數據的預測方法能夠彌補該不足,及時發現市場熱點並反映關注強度,但同時也存在不能體現傾向性等情緒因素的局限性。三亞宰客門案例表明,傾向性等情緒因素對未來市場走勢產生重要影響,預測客流量必須考慮情緒因素的作用。最新研究表明,微博數據蘊涵了眾多用戶的情緒信息,且具有顯著預測能力。本課題擬建立搜尋行為、情緒互動行為、旅遊決策之間的關聯模型,在網路搜尋預測建摸的基礎上,探索從微博情緒資料庫中挖掘旅遊傾向性等情緒指標,進一步研究情緒因素對搜尋預測模型效果的修正作用,在此基礎上,探索實現搜尋數據和微博數據優勢互補的新方法,並建立混合模型對旅遊客流量進行預測。本研究從一個新視角豐富了旅遊消費行為理論,在客流量預測方面具有創新價值,也可以為相關管理部門提供及時、可靠的決策依據。
結題摘要
客流預測是旅遊運營的重要環節,傳統預測模型難以捕獲當前市場最新動態,網際網路數據能夠及時發現市場熱點,反映遊客的關注強度和情緒變化,為客流預測開闢了新的空間。本課題以中文網路多源數據為基礎,選擇中國旅遊市場為研究對象,嘗試通過網路多源數據刻畫旅遊決策行為並對客流量展開預測,具體做了如下工作: 第一,網路行為與遊覽行為的關在線上制分析。從消費購買決策理論、信息行為理論等出發,構建了旅遊市場中網路行為與遊覽行為的關在線上制概念模型,分析了二者之間的邏輯關係與關在線上理。 第二,網路多源數據的特徵及關係分析。首先分析了網路瀏覽數據、網路搜尋數據、微博數據、客流量數據等多源數據的來源、獲取和特點;然後針對多源、海量、異構的網路數據形成了一套標準、有效的預處理方法體系:在中文搜尋數據處理上提出了CLSI(合成領先搜尋指數法),套用該方法可以建立旅遊關鍵字詞庫、篩選有預測能力的關鍵字、構建具有領先性的搜尋指數;在微博數據處理上形成了文本分析、傾向性判斷、情緒挖掘方法,可以得出不同維度的微博情緒指標;最後分析了瀏覽數據、網路搜尋數據、微博數據、客流量數據等不同數據指標之間的關係。 第三,網路數據噪聲處理和有效信號提取。本研究從網路行為的冪律分布特徵出發,套用以中心詞為起點的搜尋鏈提取技術,顯著降低了工作量和計算複雜度,並提高了預測精度。對於噪聲干擾的處理,利用HHT和GAM的方法識別和分離噪聲層,避免了噪聲干擾的影響 第四,基於搜尋數據與微博數據的混合預測研究。基於搜尋指數變數和微博情緒變數,分析並比較了時間序列模型、線性回歸模型、機器學習的隨機森林、支持向量機、神經網路模型、以及廣義加性模型的預測效果。 第五,研究成果在旅遊市場的套用及其他領域的拓展。本課題提出的研究方法在海南旅遊、九寨溝旅遊、北京園博會等客流預測中取得較為滿意的效果,得出了數據驅動的遊客抱怨分析及改進策略,相關研究成果得到了北京園博會組委會的認可。在經濟預測領域,與百度公司合作開發了“百度中小企業景氣指數”,能夠分地區、分行業反映我國中小企業經營狀況和景氣程度,該指數領先於國家統計局發布的巨觀經濟先行指數3個月,於2014年在百度大數據平台上線,在業內產生了一定影響力。 綜上,本課題豐富了客流行為及預測的相關理論,也為相關企業、政府管理部門的科學決策提供了依據。