《Spark數據分析:基於Python語言》是2019年機械工業出版社出版的圖書,作者是傑夫瑞·艾文(Jeffrey Aven)。
基本介紹
- 中文名:Spark數據分析:基於Python語言
- 作者:傑夫瑞·艾文(Jeffrey Aven)
- 譯者:王道遠譯
- 出版社:機械工業出版社
- 出版時間:2019年4月1日
- ISBN:9787111622727
《Spark數據分析:基於Python語言》是2019年機械工業出版社出版的圖書,作者是傑夫瑞·艾文(Jeffrey Aven)。
《Spark數據分析:基於Python語言》是2019年機械工業出版社出版的圖書,作者是傑夫瑞·艾文(Jeffrey Aven)。內容簡介 本書重點關注Spark項目的基本知識,從Spark核心開始,然後拓展到各種Spark擴展、Spark相關項目、Spark子項目,以及Spark所處...
《Spark快速大數據分析第2版》是2021年人民郵電出版社出版的圖書,作者是[美] 朱爾斯·S.達米吉、[美] 布魯克·韋尼希、[印] 泰瑟加塔·達斯、[美] 丹尼·李。內容簡介 本書的主角是在大數據時代應運而生的數據處理與分析利器——...
《預測分析:Python語言實現》是2017年機械工業出版社出版的圖書,作者是[美] 約瑟夫·巴布科克。內容簡介 本書著重介紹預測性分析技術,先概述了數據分析系統的基本架構和主要處理流程,然後從分類和無監督學習開始,逐一講解每種機器學習...
5.4.3 插入數據及刪除數據 107 5.4.4 組合查詢代碼示例 109 5.5 把Hive數據導入HBase 110 5.6 用Hive外部表讀取HBase數據 111 5.7 小結 112 第6章 Spark數據分析引擎 113 6.1 Spark簡介 1...
7.4 用Hive充當R的數據來源139 7.4.1 RHive組件139 7.4.2 把R圖表整合到Web頁面中145 7.5 本章小結151 第8章 大數據的分析挖掘152 8.1 基於Spark的數據挖掘技術152 8.2 Spark和Hadoop的關係153 8.3 在Ubuntu上安裝...
2.3Python基礎知識/ 實驗一Python環境搭建/ 實驗二基於Python語言的Spark實戰/ 參考文獻/ 第3章數據採集與融合/ 3.1數據資源/ 3.2常見數據採集途徑/ 3.3多源數據融合/ 實驗三網路爬蟲/ 實驗四Kafka操作/ 參考文獻/ 第4章數據存儲...
電力、網際網路等行業從業經歷,現已出版十餘本專著;擅長數據分析、數據可視化、機器學習等,精通Python、SPSS、Tableau、Power BI等數據分析工具,熟悉MySQL、SQL Server等資料庫,以及Hadoop、Hive、Zeppelin、Spark等大數據分析及可視化工具...
用於情感分析的Twitter數據挖掘,使用IBM Watson 的認知計算,利用分類和回歸進行的有監督機器學習,通過聚類進行的無監督機器學習,基於深度學習和卷積神經網路的計算機視覺,基於遞歸神經網路的深度學習,基於Hadoop、Spark和NoSQL資料庫的...
本書詳細闡述了與Hadoop 3大數據分析相關的基本解決方案,主要包括Hadoop簡介、大數據分析概述、基於MapReduce的大數據處理、Python-Hadoop科學計算和大數據分析、R-Hadoop統計數據計算、Apache Spark批處理分析、Apache Spark實時數據分析、Apach...
《Linux系統與大數據套用》主要內容包括Linux基本命令,大數據主要框架Hadoop的搭建和套用,Spark框架的套用,大數據科學計算、Python語言、網路爬蟲分析等主要大數據分析套用的工具等。本書分別從系統使用者、網路管理者、shell程式開發者、套用...
4.9基於Python平台的案例分析156 4.10小結158 4.11習題159 4.12參考文獻161第5章數據分類分析163 5.1基本概念和術語163 5.1.1數據分類163 5.1.2解決分類問題的一般方法165 5.2決策樹算法166 5.2.1決策樹歸納166 5.2.2...
此外,Spark使用Scala工作(也可以使用Java和Python等),但Scala是主要的API語言。因此Spark用Scala在數據管道的表達方面有一定的協同性。作品目錄 譯者序 前言 第1章 探索數據分析 1.1 Scala入門 1.2 去除分類欄位的重複值 1.3 ...