《基於Spark的下一代機器學習》是2021年機械工業出版社出版的圖書。
基本介紹
- 中文名:基於Spark的下一代機器學習
- 出版時間:2021年5月1日
- 出版社:機械工業出版社
- ISBN:9787111681250
《基於Spark的下一代機器學習》是2021年機械工業出版社出版的圖書。
《Python+Spark 2.0+Hadoop機器學習與大數據實戰》是2018年1月1日清華大學出版社出版的圖書,作者是林大貴。內容簡介 本書從淺顯易懂的“大數據和機器學習”原理說明入手,講述大數據和機器學習的基本概念,如分類、分析、訓練、建模、預測...
《Spark 2.x 大數據分析與機器學習實戰》是旗標出版的圖書,作者是Romeo Kienzler 內容簡介 身處於信息爆炸的時代,數據無時無刻不間斷產生,大型購物網站的會員數據、工廠大規模的感測器數據…等等,當要處理的數據規模達到大數據等級時,...
《Spark MLlib機器學習實踐》是2015年清華大學出版社出版的圖書,作者是王曉華。內容簡介 Spark作為新興的、套用範圍最為廣泛的大數據處理開源框架引起了廣泛的關注,它吸引了大量程式設計和開發人員進行相關內容的學習與開發,其中 MLlib是 ...
《Spark機器學習(第2版)》是2018年11月人民郵電出版社出版的圖書,作者是[印]拉結帝普·杜瓦、[印]曼普利特·辛格·古特拉、[南非]尼克·彭特里思。內容簡介 本書結合案例研究講解Spark 在機器學習中的套用,並介紹如何從各種公開渠道...
《Spark機器學習》是2015年人民郵電出版社出版的圖書,作者是[南非] 彭特里思(Nick Pentreath)。內容簡介 每章都設計了案例研究,以機器學習算法為主線,結合實例探討了Spark 的實際套用。書中沒有讓人抓狂的數據公式,而是從準備和正確...
《Spark MLlib機器學習:算法、源碼及實戰詳解》中本著循序漸進的原則,首先解析MLlib的底層實現基礎:數據操作及矩陣向量計算操作,該部分是MLlib實現的基礎;接著對各個機器學習算法的理論知識進行講解,並且解析機器學習算法如何在MLlib中...
《Spark 3.0大數據分析與挖掘:基於機器學習》是清華大學出版社出版的一本圖書,作者是王曉華 羅凱靖。內容簡介 Spark作為新興的、套用範圍廣泛的大數據處理開源框架,吸引了大量的大數據分析與挖掘從業人員進行相關內容的學習與開發,其中ML...
《Spark機器學習實戰》是2020年9月人民郵電出版社出版的圖書,作者是[美]西亞瑪克·阿米爾霍吉(Siamak Amirghodsi)。內容簡介 機器學習是一門多領域交叉學科,可以通過模擬來讓計算機獲取新的知識或技能。Apache Spark是一種通用大數據框架...
《HadoopSpark大數據機器學習》是2021年科學出版社出版的圖書。內容簡介 人類已進入大數據時代。大數據是指具有海量(volume)、多模態(variety)、變化速度快(velocity)、蘊含價值高(value)和不精確性高(veracity)“5V”特徵的數據。大...
第1章 大數據與機器學習 1.1 大數據定義 1.2 Hadoop簡介 1.3 Hadoop HDFS分散式檔案系統 1.4 Hadoop MapReduce的介紹 1.5 Spark的介紹 1.6 機器學習的介紹 第2章 VirtualBox虛擬機軟體的安裝 2.1 VirtualBox的下載和安裝...
Spark機器學習進階實戰 《Spark機器學習進階實戰》是2018年機械工業出版社出版的圖書。
Spark機器學習 《Spark機器學習》是2018年機械工業出版社出版的圖書。
第11章 掌握機器學習Spark MLlib 和ML 292 11.1 機器學習簡介 292 11.2 Spark機器學習API 298 11.3 特徵提取與轉換 299 11.4 創建一個簡單的pipeline 308 11.5 無監督機器學習 309 11.6 分類 314 11.7 本章小結 330 第...
當下Spark已不止步於實時計算,目標直指通用大數據處理平台,而終止Spark,開啟SparkSQL或許已經初見端倪。大數據機器學習和數據挖掘的並行化算法研究成為大數據領域一個較為重要的研究熱點。早幾年國內外研究者和業界比較關注的是在 Hadoop ...
10.3.1 基於樹的模型 267 10.3.2 k 折交叉驗證 274 10.3.3 最佳化流水線 277 10.4 小結 279 第 11 章 用Apache Spark管理、部署與伸縮機器學習流水線 280 11.1 模型管理 280 11.2 用MLlib 部署模型所用的...
第8章 Spark MLlib 187 8.1 Spark MLlib概述 187 8.1.1 機器學習介紹 187 8.1.2 Spark MLlib簡介 189 8.2 MLlib向量與矩陣 190 8.2.1 MLlib向量 190 8.2.2 MLlib矩陣 192 8.3 Spark MLlib分類算法 196 8.3.1...
《大規模數據分析和建模:基於Spark與R》是2020年機械工業出版社出版的圖書。 內容簡介 這本書的目的是幫助所有人通過R使用Apache Spark。第1章~第5章,簡單地介紹了如何大規模執行數據科學和機器學習項目。第6~9章介紹了使用Spark進行...
使用自動編碼器和異常檢測進行欺詐分析”“使用遞歸神經網路識別人類活動”和“使用卷積神經網路進行圖像分類”等11個完整的項目,結合Spark ML、H2O、Zeppelin、DeepLearning4j和MXNet等流行機器學習庫以及一些經典數據集為讀者介紹了機器學習...
本書詳細闡述了與Spark實時大數據分析以及Spark Streaming框架相關的基本解決方案,主要包括大數據漫遊指南,實時RDD,高速流:連結外部數據源,邊界效應,實時ETL和分析技術,大規模機器學習,雲、Lambda及Python等內容。此外,本書還提供了豐富...
本書是使用Spark進行大規模數據分析的實戰寶典,由大數據公司Cloudera的數據科學家撰寫。四位作者首先結合數據科學和大數據分析的廣闊背景講解了Spark,然後介紹了用Spark和Scala進行數據處理的基礎知識,接著討論了如何將Spark用於機器學習,同時...
17.4.2 基於Direct模式的KafKa集成 278 17.5 I/O檔案事件流操作 280 17.5.1 基於路徑掃描的Spark Streaming 281 17.5.2 打包至工程的dist 284 17.5.3 啟動集群 284 第18章 Spark機器學習 289 18.1 機器學習原理 289 18....
5.9.1 基於列存儲數據塊的並行學習188 5.9.2 快取感知訪問190 5.9.3 外存塊計算191 5.10 小結192 第6章 分散式XGBoost193 6.1 分散式機器學習框架Rabit 193 6.1.1 AllReduce193 6.1.2 Rabit195 6.1.3 Rabit套用...
8.1 Spark與R語言 241 8.1.1 R語言簡介 242 8.1.2 通過R語言使用Spark 248 8.1.3 練習:在RStudio中使用SparkR 255 8.2 Spark機器學習 257 8.2.1 機器學習基礎 257 8.2.2 使用Spark MLlib進行機器學習 260 8....
最近幾年,大規模的深度學習在實際套用中獲得了巨大的成功,特別是在語音識別和圖像識別等領域取得了突破性進展。根據技術路線的差異,目前分散式機器學習系統可以劃分為三類:基於Hadoop、基於Spark和參數伺服器架構。Mahout是在Hadoop上構建的...