《基於改進的GBDT算法的乘客出行預測研究》是王天華撰寫的一篇論文。
基本介紹
- 中文名:基於改進的GBDT算法的乘客出行預測研究
- 作者:王天華
- 論文來源:大連理工大學
- 發表時間:2016
- 分類號:U491.17
論文摘要,引文格式,
論文摘要
隨著大數據和網際網路技術的快速發展,從複雜無序的大數據中,給用戶推薦用戶自身感興趣的信息,推薦系統已經成為解決信息過載的關鍵工具。首先根據用戶的歷史行為的記錄,構建相應的特徵工程,利用特徵工程來進行建模,然後預測未來用戶的興趣,最終推薦相應的物品給用戶。但現在推薦還是面對許多困難和挑戰,例如如何選擇適當的推薦算法來提升正樣本(小類樣本)預測的準確性,提高用戶感興趣物品的準確度等。為了更好的處理上述問題,研究人員繼續開發出更高效的推薦算法。本文的研究主要面對的是在公共運輸大數據情況下,乘客與線路之間顯性關係信息缺少,隱形關係信息巨大,和同時乘客是否出行問題可以轉化為二分類問題,並且乘客未來選擇出行的數目遠遠小於不出行的特點,從而本文主要關注如何構建有效的特徵工程和如何解決不平衡分類問題來提升正樣本(小類樣本)分類準確性。基於以上問題,本文提出了一種基於代價敏感學習和隨機梯度提升的算法融合思想,從而使預測乘客是否出行更加準確。首先,採用廣州省公共運輸數據集,來構建用戶乘車習慣相應的特徵工程,本文主要從乘客,線路和乘客線路互動三個方向來進行構建特徵工程。構建的角度主要從時間,天氣,頻率等。
引文格式
王天華. 基於改進的GBDT算法的乘客出行預測研究[D].大連理工大學,2016.