《大數據技術與套用基礎項目教程》是2019年12月人民郵電出版社出版的圖書,作者是李俊傑、謝志明。
基本介紹
- 書名:大數據技術與套用基礎項目教程
- 作者:李俊傑、謝志明
- ISBN:9787115473332
- 頁數:298頁
- 定價:49.8元
- 出版社:人民郵電出版社
- 出版時間:2019年12月
- 裝幀:平裝
- 開本:16開
內容簡介,圖書目錄,
內容簡介
全書共十個項目,除了項目一介紹大數據基礎理論外,其餘項目均以實戰為主線,內容循序漸進,逐步深入,圍繞大數據技術的套用層層展開。內容主要包括大數據的基本概念、Ubuntu及服務安裝配置、Hadoop集群部署、MapReduce編程、HBase資料庫部署與套用、Hive數據倉庫安裝與套用、Pig數據分析、Sqoop數據遷移、Spark部署及數據分析等知識,最後以大數據技術的具體套用介紹了MapReduce大數據編程、Mahout的K-Means計算、決策樹和隨機森林的分類預測、頻繁項集運算和關聯分析等知識。本書秉承“實踐為主、理論夠用,注重實用”原則,將實驗環節及實操內容融入各個知識點與課程教學中,以便讀者能更好地學習和掌握大數據關鍵技術。
圖書目錄
項目一 走進大數據 1
任務1 概述大數據的內涵 2
任務2 關注大數據的影響 6
任務3 認識常見的大數據計算模式 11
任務4 釐清大數據處理的基本流程 14
任務5 大數據套用大顯神通 15
任務6 大數據的發展及面臨的挑戰 18
【同步訓練】 22
項目二 Ubuntu及服務安裝配置 23
任務1 安裝Ubuntu Server 24
任務2 搭建FTP系統 33
任務3 搭建MySQL資料庫系統 37
任務4 安裝Ubuntu Desktop 41
【同步訓練】 47
項目三 Hadoop集群部署 48
任務1 構建集群系統 49
任務2 SSH證書登錄 54
任務3 Hadoop部署與使用 56
【同步訓練】 76
項目四 MapReduce編程 77
任務1 搭建MapReduce開發平台 78
任務2 編寫單詞計數程式 82
任務3 編寫氣象數據分析程式 96
【同步訓練】 111
項目五 HBase資料庫部署與套用 112
任務1 HBase部署 113
任務2 HBase Shell 125
任務3 HBase編程 136
任務4 MapReduce與HBase集成 144
【同步訓練】 154
項目六 Hive數據倉庫安裝與套用 155
任務1 安裝Hive 155
任務2 Hive CLI 168
任務3 Hive編程 182
任務4 Hive與HBase集成 186
【同步訓練】 187
項目七 Pig數據分析 188
任務1 Pig安裝及使用 188
任務2 Pig高級編程 200
【同步訓練】 209
項目八 Sqoop數據遷移 210
任務1 Sqoop安裝及MySQL與HDFS數據遷移 210
任務2 MySQL與Hive/HBase數據轉移 216
【同步訓練】 218
項目九 Spark部署及數據分析 219
任務1 Spark部署 220
任務2 Spark數據分析 229
任務3 Spark編程 241
【同步訓練】 252
項目十 大數據綜合實例編程 253
任務1 MapReduce大數據處理 254
任務2 Mahout的K-Means計算 266
任務3 決策樹和隨機森林的分類預測 272
任務4 頻繁項集計算與關聯分析 287
【同步訓練】 297
參考文獻 298