大數據技術基礎實驗

大數據技術基礎實驗

《大數據技術基礎實驗》是2020年北京郵電大學出版社出版的圖書,作者是歐中洪、宋美娜、鄂海紅 。

基本介紹

  • 中文名:大數據技術基礎實驗
  • 作者:歐中洪、宋美娜、鄂海紅
  • 出版社: 北京郵電大學出版社
  • 出版時間:2020年1月1日
  • ISBN:9787563558735
內容簡介,圖書目錄,作者簡介,

內容簡介

《大數據技術基礎實驗》為“大數據技術基礎”的實驗教程,可以和《大數據技術基礎》教材配套使用。該書主要分為五大部分:大數據存儲技術實驗教程(分散式檔案系統和NoSQL資料庫),大數據處理框架實驗教程(MapReduce和Spark、實時處理框架Storm和Flink),大數據分析技術實驗教程(Druid、Drill、Kylin),大數據可視化實驗教程,大數據綜合套用實驗案例。該書圍繞典型大數據套用系統所需的各個組成部分設計實驗,指導讀者開展大數據套用實踐。
  《大數據技術基礎實驗》可作為計算機學科相關專業,尤其是數據科學與大數據技術專業的專業教材,也可作為大數據相關專業從業人員的參考用書。

圖書目錄

第1章大數據存儲:分散式檔案系統及NoSQL資料庫實驗教程1
1.1HDFS常用操作1
1.2HBase的安裝6
1.3HBase的Shell連線與數據操作7
1.4Redis資料庫的安裝和使用11
1.5MongoDB資料庫的安裝和使用17
1.6Neo4j資料庫的安裝和使用22
第2章大數據處理:MapReduce處理框架實驗教程27
2.1實驗目的27
2.2實驗要求27
2.3預備知識27
2.4實驗內容(5個實驗)28
2.5實驗作業64
2.6擴展資料65
2.7參考答案78
第3章大數據處理:分散式處理框架Spark實驗教程79
3.1Spark安裝79
3.2Sparkshell83
3.3Spark Scala87
3.4Spark Python99
3.5Spark MLlib103
第4章大數據處理:實時處理框架實驗教程110
4.1Storm偽分散式部署及其基本操作110
4.2Flume安裝及其基本操作124
4.3Kafka安裝及其基本操作131
4.4Spark Streaming安裝及其基本操作135
4.5Flink安裝及其基本操作150
第5章大數據分析:分散式數據查詢實驗教程164
5.1Hive的數據導入與數據查詢164
5.2Druid的安裝171
5.3Druid的數據攝入與數據查詢175
5.4Drill的部署181
5.5Drill命令行與PyDrill的基礎使用183
第6章大數據分析:Kylin多維分析實驗教程186
6.1Kylin的安裝186
6.2Demo案例實戰189
6.3多維分析的Cube創建實戰193
6.4通過RESTful訪問Kylin208
第7章大數據可視化實驗教程215
7.1ECharts數據可視化215
7.2Plotly數據可視化218
7.3D3.js繪製知識圖譜222
第8章大數據綜合實驗案例231
8.1案例簡介231
8.2實驗步驟232
8.3數據集下載232
8.4數據集導入數據倉庫Hive233
8.5Hive數據分析237
8.6數據挖掘240
參考文獻247

作者簡介

歐中洪,北京郵電大學計算機學院副院長,副教授;科技部現代服務業共性服務聯盟副秘書長,中國通信標準化協會TC11 VR/AR子工作組副組長,中國網際網路協會青年專家。長期從事大數據分析、人工智慧與深度學習、雲計算與分散式系統等方面的研究工作。研究成果曾被BBC News,ACM TechNews,The Registry等國際知名媒體報導。主持或承擔國家重點研發計畫、國家科技支撐計畫、國家自然科學基金項目等多項,發表高水平學術論文60餘篇,其中SCI檢索20餘篇。擔任多個國際知名期刊的審稿人,多個國際知名學術會議的程式委員會主席或委員。

相關詞條

熱門詞條

聯絡我們