《交通時空大數據分析、挖掘與可視化(Python版)》是2022年清華大學出版社出版的圖書,作者是餘慶、李瑋峰。
基本介紹
- 中文名:交通時空大數據分析、挖掘與可視化(Python版)
- 作者:餘慶、李瑋峰
- 出版社:清華大學出版社
- 出版時間:2022年9月1日
- 定價:169 元
- ISBN:9787302611967
內容簡介,圖書目錄,作者簡介,
內容簡介
大數據時代已經到來,隨著數據的逐步開放,交通領域的研究課題或多或少都要接觸、使用時空大數據。交通領域的從業者迫切需要強有力的工具和技術應對日益紛雜的交通數據。交通是一個交叉學科,交通數據分析人才的知識體系需要與數據處理、網路爬蟲、數據可視化、地理信息、複雜網路、數據挖掘、機器學習等多學科知識深度融合,這也為交通領域的人才培養帶來巨大挑戰。
在此背景下,本書針對不同的學習階段與業務需求設計了三篇共15章內容。基礎篇(第1~5章)梳理Python數據分析、網路爬蟲、數據可視化、地理信息等基礎知識;套用篇(第6~10章)介紹計程車GPS數據、捷運IC刷卡數據、共享腳踏車訂單數據、公交GPS數據等各類時空大數據的實際案例套用;方法篇(第11~15章)融匯數據挖掘、空間統計、複雜網路學科等交叉學科方法,與交通領域的大量實際案例分析結合,全面梳理總結交通時空大數據所需跨學科技能。
本書由淺入深,學科交叉,強調實踐。對讀者不同的學習階段與業務需求設計相應內容,全面梳理總結交通大數據科研所需技能,並與交通領域的大量實際案例分析結合。本書可作為教材也可作為參考工具書,基礎篇定位交通數據領域新手入門,套用篇定位有數據分析需求的高校學生或社會人士,方法篇定位高校學術科研人員。
圖書目錄
基 礎 篇
第1章 緒論 ·····························2
1.1 多源交通時空大數據簡介 ················2
1.1.1 傳統集計統計數據 ·······························3
1.1.2 個體連續追蹤數據 ·······························4
1.1.3 地理空間信息數據 ·······························5
1.2 為什麼要用Python處理交通大數據 ·····6
1.2.1 常用數據處理技術 ·······························6
1.2.2 Python在交通大數據領域中的優勢 ····8
1.2.3 Python與SQL的比較 ····························9
1.3 大規模數據處理的解決方案··············9
1.3.1 決定大數據處理性能的三個硬體
要素 ·······················································9
1.3.2 分散式數據處理架構 ·························11
1.4 本章習題 ···································14
第2章 Python數據處理基礎 ······15
2.1 Python的環境配置 ························15
2.1.1 Python的集成開發環境 ······················15
2.1.2 Anaconda的安裝 ·································16
2.1.3 Jupyter Notebook的使用 ·····················16
2.1.4 Python第三方庫的安裝 ······················18
2.2 Python基本語法 ···························19
2.2.1 對象與變數 ·········································19
2.2.2 運算符 ·················································20
2.2.3 內置數據類型 ·····································20
2.2.4 語句 ·····················································24
2.2.5 函式 ·····················································26
2.2.6 包的使用 ·············································27
2.2.7 數據分析常用第三方庫簡介 ·············28
2.3 pandas數據處理基礎 ·····················29
2.3.1 數據檔案的編碼格式與存儲形式 ·····30
2.3.2 數據表的行列處理 ·····························33
2.3.3 數據的表格運算 ·································41
2.4 時空大數據的處理思維 ·················46
2.4.1 複雜數據處理任務的解決思路 ·········46
2.4.2 數據處理任務分解實例:捷運換乘量
識別 ······················································49
2.5 數據處理中表格運算的常用技巧 ······51
2.5.1 分組編號 ·············································51
2.5.2 去除重複的記錄 ·································53
2.5.3 個體ID重新編號 ·································54
2.5.4 生成數據之間的對應表 ·····················55
2.5.5 時空插值 ·············································58
2.6 本章習題 ···································60
2.6.1 思考題 ·················································60
2.6.2 Python基礎代碼練習 ··························60
2.6.3 pandas基礎代碼練習 ··························62
第3章 數據可視化基礎 ············64
3.1 可視化的基本原則 ·······················64
作者簡介
餘慶(交通數據小旭學長)
博士,南方科技大學斯發基斯可信自主系統研究院助理研究員,交通時空大數據開源Python庫TransBigData作者。B站交通時空大數據相關視頻課程總播放量超過80萬。2022年博士畢業於同濟大學交通運輸工程專業,博士期間赴日本東京大學公派聯合培養,主要研究方向為交通大數據分析、數據可視化、城市計算,發表SCI論文十餘篇。自2020年起在B站上製作交通時空大數據相關課程,涵蓋時空數據處理、數據可視化等。
李瑋峰
同濟大學交通運輸工程學院助理研究員,博士。主要研究方向為交通規劃、智慧型交通系統規劃和交通大數據分析。參加國家重點研發計畫項目1項、國家自然科學基金重點項目2項、面上項目2項,國家科技支撐計畫項目2項,同時參加地方政府和科研院所的研究與諮詢項目多項。發表期刊及會議論文50餘篇,其中SCI收錄16篇、EI收錄20餘篇;完成專著3本;獲得發明專利4項,軟體著作權3項。