大數據項目實戰

大數據項目實戰

《大數據項目實戰》是2020年清華大學出版社出版的圖書。

基本介紹

  • 中文名:大數據項目實戰
  • 作者:黑馬程式設計師
  • 出版社:清華大學出版社
  • 出版時間:2020年3月1日
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787302550938
內容簡介,圖書目錄,作者簡介,

內容簡介

《大數據項目實戰/大數據技術與套用叢書》講解了一個大數據綜合項目——招聘網站職位分析。全書共分為6章,內容分別是項目概述、搭建大數據集群環境、數據採集、數據預處理、數據分析與數據可視化。
  《大數據項目實戰/大數據技術與套用叢書》附有配套資源,包括原始碼、教學設計、教學課件等資源。同時為了幫助初學者更好地學習《大數據項目實戰/大數據技術與套用叢書》內容,還提供了線上答疑,歡迎讀者關注。
  《大數據項目實戰/大數據技術與套用叢書》適用於高等院校本、專科計算機相關專業大數據項目實訓課程的教學,書中的具體項目,有助於讀者綜合運用大數據課程知識及各種工具軟體,實現大數據分析全流程操作。

圖書目錄

第1章 項目概述
1.1 項目需求和目標
1.2 預備知識
1.3 項目架構設計及技術選取
1.4 開發環境和開發工具介紹
1.5 項目開發流程
小結
第2章 搭建大數據集群環境
2.1 安裝準備
2.1.1 虛擬機安裝與克隆
2.1.2 虛擬機網路配置
2.1.3 SSH服務配置
2.2 Hadoop集群搭建
2.2.1 JDK安裝
2.2.2 Hadoop安裝
2.2.3 Hadoop集群配置
2.2.4 Hadoop集群測試
2.2.5 通過UI界面查看Hadoop運行狀態
2.3 Hive安裝
2,3.1 Hive的安裝模式
2.3.2 Hive的安裝
2.4 Sqoop安裝
小結
第3章 數據採集
3.1 知識概要
3.1.1 數據源分類
3.1.2 HTTP請求過程
3.1.3 認識HttpClient
3.2 分析與準備
3.2.1 分析網頁數據結構
3.2.2 數據採集環境準備
3.3 採集網頁數據
3.3.1 創建回響結果JavaBean類
3.3.2 封裝HTTP請求的工具類
3.3.3 封裝存儲在HDFS的工具類
3.3.4 實現網頁數據採集
小結
第4章 數據預處理
4.1 分析預處理數據
4.2 設計數據預處理方案
4.3 實現數據的預處理
4.3.1 數據預處理環境準備
4.3.2 創建數據轉換類
4.3.3 創建實現Map任務的Mapper類
4.3.4 創建並執行MapReduce程式
4.4 將數據預處理程式提交到集群中運行
小結
第5章 數據分析
5.1 數據分析概述
5.2 Hive數據倉庫
5.2.1 什麼是Hive
5.2.2 設計Hive數據倉庫
5.2.3 實現數據倉庫
5.3 分析數據
5.3.1 職位區域分析
5.3.2 職位薪資分析
5.3.3 公司福利分析
5.3.4 職位技能要求分析
小結
……
第6章 數據可視化

作者簡介

江蘇傳智播客教育科技股份有限公司(簡稱傳智播客)是一家致力於培養高素質軟體開發人才的科技公司,“黑馬程式設計師”是傳智播客旗下高端IT教育品牌。

相關詞條

熱門詞條

聯絡我們