《Spark機器學習》是2015年人民郵電出版社出版的圖書,作者是[南非] 彭特里思(Nick Pentreath)。
基本介紹
- 中文名:Spark機器學習
- 作者:[南非] 彭特里思(Nick Pentreath)
- 出版時間:2015年
- 出版社:人民郵電出版社
- 頁數:224 頁
- ISBN:9787115399830
- 類別:機器學習
- 定價:59 元
- 開本:16 開
- 裝幀:平裝
- 正文語種:中文
- 包裝:平裝
- 用紙:膠版紙
- 叢書名:圖靈程式設計叢書
《Spark機器學習》是2015年人民郵電出版社出版的圖書,作者是[南非] 彭特里思(Nick Pentreath)。
《Spark機器學習(第2版)》是2018年11月人民郵電出版社出版的圖書,作者是[印]拉結帝普·杜瓦、[印]曼普利特·辛格·古特拉、[南非]尼克·彭特里思。內容簡介 本書結合案例研究講解Spark 在機器學習中的套用,並介紹如何從各種公開渠道...
Spark機器學習 《Spark機器學習》是2018年機械工業出版社出版的圖書。
《Spark機器學習實戰》是2020年9月人民郵電出版社出版的圖書,作者是[美]西亞瑪克·阿米爾霍吉(Siamak Amirghodsi)。內容簡介 機器學習是一門多領域交叉學科,可以通過模擬來讓計算機獲取新的知識或技能。Apache Spark是一種通用大數據框架...
《Python+Spark 2.0+Hadoop機器學習與大數據實戰》是2018年1月1日清華大學出版社出版的圖書,作者是林大貴。內容簡介 本書從淺顯易懂的“大數據和機器學習”原理說明入手,講述大數據和機器學習的基本概念,如分類、分析、訓練、建模、預測...
《Spark 3.0大數據分析與挖掘:基於機器學習》是清華大學出版社出版的一本圖書,作者是王曉華 羅凱靖。內容簡介 Spark作為新興的、套用範圍廣泛的大數據處理開源框架,吸引了大量的大數據分析與挖掘從業人員進行相關內容的學習與開發,其中ML...
《Hadoop/Spark大數據機器學習》是2021年科學出版社出版的圖書。內容簡介 人類已進入大數據時代。大數據是指具有海量(volume)、多模態(variety)、變化速度快(velocity)、蘊含價值高(value)和不精確性高(veracity)“5V”特徵的數據。...
《Spark 2.x 大數據分析與機器學習實戰》是旗標出版的圖書,作者是Romeo Kienzler 內容簡介 身處於信息爆炸的時代,數據無時無刻不間斷產生,大型購物網站的會員數據、工廠大規模的感測器數據…等等,當要處理的數據規模達到大數據等級時,...
Spark機器學習進階實戰 《Spark機器學習進階實戰》是2018年機械工業出版社出版的圖書。
《Spark MLlib機器學習:算法、源碼及實戰詳解》中本著循序漸進的原則,首先解析MLlib的底層實現基礎:數據操作及矩陣向量計算操作,該部分是MLlib實現的基礎;接著對各個機器學習算法的理論知識進行講解,並且解析機器學習算法如何在MLlib中...
《基於Spark的下一代機器學習》是2021年機械工業出版社出版的圖書。內容簡介 本書先簡單介紹了Spark和Spark MLlib,然後介紹標準Spark MLlib庫之外的更強大的第三方機器學習算法和庫。通過閱讀本書,你將能夠通過幾十個實際的例子和深刻...
《Spark MLlib機器學習實踐》是2015年清華大學出版社出版的圖書,作者是王曉華。內容簡介 Spark作為新興的、套用範圍最為廣泛的大數據處理開源框架引起了廣泛的關注,它吸引了大量程式設計和開發人員進行相關內容的學習與開發,其中 MLlib是 ...
《PySpark機器學習、自然語言處理與推薦系統》是清華大學出版社於2020年1月1日出版的一本圖書 ,作者[印]普拉莫德·辛格(Pramod Singh),翻譯蒲成。圖書內容 構建一系列有監督和無監督機器學習算法 使用Spark MLlib庫實現機器學習算法 ...
11.1 機器學習簡介 292 11.2 Spark機器學習API 298 11.3 特徵提取與轉換 299 11.4 創建一個簡單的pipeline 308 11.5 無監督機器學習 309 11.6 分類 314 11.7 本章小結 330 第12章 貝葉斯與樸素貝葉斯 332 12.1 多元分類 ...
當下Spark已不止步於實時計算,目標直指通用大數據處理平台,而終止Spark,開啟SparkSQL或許已經初見端倪。大數據機器學習和數據挖掘的並行化算法研究成為大數據領域一個較為重要的研究熱點。早幾年國內外研究者和業界比較關注的是在 Hadoop ...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者閱讀...
其中,第6章介紹了Spark SQL,可以高效的處理結構化數據;第7章介紹了Spark Streaming,可以高效的處理流式數據;第8章介紹了Spark GraphX,可以高效的處理圖數據;第9章和第10章介紹了Spark ML,分別以Spark機器學習原理和Spark機器學習...
7.1.3 使用Spark進行機器學習 7.2 Spark中的線性代數 7.2.1 本地向量與矩陣實現 7.2.2 分散式矩陣 7.3線性回歸 7.3.1 有關線性回歸 7.3.2 簡單的線性回歸 7.3.3 將模型擴展到多元線性回歸 7.4分析和準備數據 7.4....
6.1Spark機器學習庫 6.1.1Spark機器學習簡介 6.1.2算法概覽 6.2各個算法介紹和編程實戰 6.2.1推薦算法交替最小二乘法 6.2.2邏輯回歸 6.2.3決策樹 6.2.4隨機森林 6.2.5梯度提升決策樹 6.2.6支持向量機 6.2.7樸素...
《機器學習系統》是2019年9月清華大學出版社出版的圖書,作者是[美]傑夫·史密斯(Jeff Smith)。內容簡介 使用Spark、MLlib和Akka反應式設計模式監控和維護大型系統特徵、actor和監督,讀者需要具備Java或Scala中級技能,但不需要有機器學習...
第二部分Spark大數據處理框架的核心理論(第3~4章):介紹Spark框架將應用程式轉化為邏輯處理流程,進而轉化為可並行執行的物理執行計畫的一般過程及方法。第三部分典型的Spark套用(第5章):介紹疊代型的Spark機器學習套用和圖計算套用。...
8.3.2Spark GraphX的實現 8.3.3Spark GraphX圖算法的實現方法 8.4Spark GraphX圖操作實例 8.4.1基於Spark GraphX的屬性圖的操作實例 8.4.2Spark GraphX圖算法操作實例 思考題 第9章MLlib 9.1機器學習簡介 9.1.1機器學習...
本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的原理和實戰,億級數據處理平台Spark性能調優,Spark機器學習庫,Spark 3.0的新...
運行Spark 第2章Spark淺析 Spark的基本架構 SparkAPI的多語言支持 SparkAPI 啟動Spark 轉換操作 動作操作 Spark用戶接口 一個完整的例子 小結 第3章Spark工具集介紹 運行生產應用程式 Dataset:類型安全的結構化API 結構化流處理 機器學習...
10.1.1 監督學習 248 10.1.2 無監督學習 249 10.1.3 為什麼將Spark 用於機器學習 250 10.2 設計機器學習流水線 251 10.2.1 接入並探索數據 251 10.2.2 創建訓練集與測試集 252 10.2.3 為轉化器準備...
7.10實驗3: Spark機器學習實驗239 7.11拓展閱讀——工匠精神240 7.12習題241 第8章數據可視化242 8.1WordCloud242 8.2PyeCharts247 8.2.1繪製柱狀圖248 8.2.2繪製折線圖250 8.2.3繪製餅圖252 8.2.4繪製雷達圖252 8.2....
5.2 開源機器學習庫的核心功能 126 5.3 了解scikit-learn機器學習庫 126 5.3.1 安裝scikit-learn 127 5.3.2 scikit-learn的核心組件 127 5.4 了解Apache Spark機器學習機器學習庫 129 5.4.1 安裝Spark ML 131 5....