《Spark機器學習》是2018年機械工業出版社出版的圖書。
基本介紹
- 中文名:Spark機器學習
- 出版時間:2018年
- 出版社:機械工業出版社
- ISBN:9787111598466
《Spark機器學習》是2018年機械工業出版社出版的圖書。
《Spark機器學習(第2版)》是2018年11月人民郵電出版社出版的圖書,作者是[印]拉結帝普·杜瓦、[印]曼普利特·辛格·古特拉、[南非]尼克·彭特里思。內容簡介 本書結合案例研究講解Spark 在機器學習中的套用,並介紹如何從各種公開渠道獲取用於機器學習系統的數據。內容涵蓋推薦系統、回歸、聚類、降維等經典機器學習...
《Spark機器學習實戰》是2020年9月人民郵電出版社出版的圖書,作者是[美]西亞瑪克·阿米爾霍吉(Siamak Amirghodsi)。內容簡介 機器學習是一門多領域交叉學科,可以通過模擬來讓計算機獲取新的知識或技能。Apache Spark是一種通用大數據框架,也是一種近實時彈性分散式計算和數據虛擬化技術,Spark使人們可以大規模使用機器...
Spark機器學習 《Spark機器學習》是2018年機械工業出版社出版的圖書。
《Spark 3.0大數據分析與挖掘:基於機器學習》是清華大學出版社出版的一本圖書,作者是王曉華 羅凱靖。內容簡介 Spark作為新興的、套用範圍廣泛的大數據處理開源框架,吸引了大量的大數據分析與挖掘從業人員進行相關內容的學習與開發,其中ML是Spark 3.0機器學習框架使用的核心。本書用於Spark 3.0 ML大數據分析與挖掘...
《Spark MLlib機器學習:算法、源碼及實戰詳解》中本著循序漸進的原則,首先解析MLlib的底層實現基礎:數據操作及矩陣向量計算操作,該部分是MLlib實現的基礎;接著對各個機器學習算法的理論知識進行講解,並且解析機器學習算法如何在MLlib中實現分散式計算;然後對MLlib源碼進行詳細的講解;最後進行MLlib實例的講解。相信...
《Hadoop/Spark大數據機器學習》是2021年科學出版社出版的圖書。內容簡介 人類已進入大數據時代。大數據是指具有海量(volume)、多模態(variety)、變化速度快(velocity)、蘊含價值高(value)和不精確性高(veracity)“5V”特徵的數據。大數據給傳統的機器學習帶來巨大的挑戰,已引起學術界和工業界的高度關注。Hadoop...
《Python+Spark 2.0+Hadoop機器學習與大數據實戰》是2018年1月1日清華大學出版社出版的圖書,作者是林大貴。內容簡介 本書從淺顯易懂的“大數據和機器學習”原理說明入手,講述大數據和機器學習的基本概念,如分類、分析、訓練、建模、預測、機器學習(推薦引擎)、機器學習(二元分類)、機器學習(多元分類)、機器學習...
《Spark MLlib機器學習實踐(第2版)》是2017年3月1日清華大學出版社出版的圖書,作者是王曉華。圖書簡介 Spark作為新興的、套用範圍最為廣泛的大數據處理開源框架引起了廣泛的關注,它吸引了大量程式設計和開發人員進行相關內容的學習與開發,其中MLlib是Spark框架使用的核心。本書是一本細緻介紹Spark MLlib程式設計的...
《Spark 2.x 大數據分析與機器學習實戰》是旗標出版的圖書,作者是Romeo Kienzler 內容簡介 身處於信息爆炸的時代,數據無時無刻不間斷產生,大型購物網站的會員數據、工廠大規模的感測器數據…等等,當要處理的數據規模達到大數據等級時,就不再是單機的 R 或 Python 可以應付得來的。 Apache Spark 是一套分散式和...
《PySpark機器學習、自然語言處理與推薦系統》是清華大學出版社於2020年1月1日出版的一本圖書 ,作者[印]普拉莫德·辛格(Pramod Singh),翻譯蒲成。圖書內容 構建一系列有監督和無監督機器學習算法 使用Spark MLlib庫實現機器學習算法 使用Spark MLlib庫開發推薦系統 處理與特徵工程、分類平衡、偏差和方差以及交叉驗...
《基於Spark的下一代機器學習》是2021年機械工業出版社出版的圖書。內容簡介 本書先簡單介紹了Spark和Spark MLlib,然後介紹標準Spark MLlib庫之外的更強大的第三方機器學習算法和庫。通過閱讀本書,你將能夠通過幾十個實際的例子和深刻的解釋,將所學到的知識套用到真實世界的用例。圖書目錄 目錄 前言 致謝 關於...
Spark機器學習進階實戰 《Spark機器學習進階實戰》是2018年機械工業出版社出版的圖書。
11.1 機器學習簡介 292 11.2 Spark機器學習API 298 11.3 特徵提取與轉換 299 11.4 創建一個簡單的pipeline 308 11.5 無監督機器學習 309 11.6 分類 314 11.7 本章小結 330 第12章 貝葉斯與樸素貝葉斯 332 12.1 多元分類 332 12.2 貝葉斯推理 338 12.3 樸素貝葉斯 339 12.4 決策樹 349 12.5 ...
Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用並行框架,Spark,擁有Hadoop MapReduce所具有的優點;但不同於MapReduce的是——Job中間輸出結果可以保存在記憶體中,從而不再需要讀寫HDFS,因此Spark能更好地適用於數據挖掘與機器學習等需要疊代的MapReduce的算法。Spark ...
對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平台搭建在多台實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》非常適合於學習大數據基礎知識的初學者閱讀,更適合正在學習大數據理論和技術的人員作為上機實踐用的教材。
其中,第6章介紹了Spark SQL,可以高效的處理結構化數據;第7章介紹了Spark Streaming,可以高效的處理流式數據;第8章介紹了Spark GraphX,可以高效的處理圖數據;第9章和第10章介紹了Spark ML,分別以Spark機器學習原理和Spark機器學習模型為重點進行介紹。Spark是一種快速、通用、可擴展的大數據分析引擎,它的一個...
6.1Spark機器學習庫 6.1.1Spark機器學習簡介 6.1.2算法概覽 6.2各個算法介紹和編程實戰 6.2.1推薦算法交替最小二乘法 6.2.2邏輯回歸 6.2.3決策樹 6.2.4隨機森林 6.2.5梯度提升決策樹 6.2.6支持向量機 6.2.7樸素貝葉斯 6.2.8序列模式挖掘PrefixSpan 6.2.9Word2vec詞向量模型 6.2.10多層...
《圖解Spark 大數據快速分析實戰》是2022年人民郵電出版社出版的圖書。內容簡介 本書共8章,內容主要包括Spark概述及入門實戰,Spark的作業調度和資源分配算法,Spark SQL、DataFrame、Dataset的原理和實戰,深入理解Spark數據源,流式計算的原理和實戰,億級數據處理平台Spark性能調優,Spark機器學習庫,Spark 3.0的新特性...
7.1.3 使用Spark進行機器學習 7.2 Spark中的線性代數 7.2.1 本地向量與矩陣實現 7.2.2 分散式矩陣 7.3線性回歸 7.3.1 有關線性回歸 7.3.2 簡單的線性回歸 7.3.3 將模型擴展到多元線性回歸 7.4分析和準備數據 7.4.1 分析數據分布 7.4.2 分析列餘弦相似性 7.4.3 協方差矩陣的計算 7.4.4...
第二部分Spark大數據處理框架的核心理論(第3~4章):介紹Spark框架將應用程式轉化為邏輯處理流程,進而轉化為可並行執行的物理執行計畫的一般過程及方法。第三部分典型的Spark套用(第5章):介紹疊代型的Spark機器學習套用和圖計算套用。第四部分大數據處理框架性能和可靠性保障機制(第6~9章):介紹Spark框架的...
8.2.3Spark GraphX圖的操作 8.3Spark GraphX架構 8.3.1Pregel圖計算框架 8.3.2Spark GraphX的實現 8.3.3Spark GraphX圖算法的實現方法 8.4Spark GraphX圖操作實例 8.4.1基於Spark GraphX的屬性圖的操作實例 8.4.2Spark GraphX圖算法操作實例 思考題 第9章MLlib 9.1機器學習簡介 9.1.1機器學習...
7.10實驗3: Spark機器學習實驗239 7.11拓展閱讀——工匠精神240 7.12習題241 第8章數據可視化242 8.1WordCloud242 8.2PyeCharts247 8.2.1繪製柱狀圖248 8.2.2繪製折線圖250 8.2.3繪製餅圖252 8.2.4繪製雷達圖252 8.2.5繪製漏斗圖253 8.2.6繪製3D柱狀圖254 8.2.7繪製詞雲圖255 8.3Plotly256 ...
《機器學習系統》是2019年9月清華大學出版社出版的圖書,作者是[美]傑夫·史密斯(Jeff Smith)。內容簡介 使用Spark、MLlib和Akka反應式設計模式監控和維護大型系統特徵、actor和監督,讀者需要具備Java或Scala中級技能,但不需要有機器學習經驗。圖書目錄 第Ⅰ部分 反應式機器學習基礎知識 第1章 學習反應式機器學習 3 ...
ApacheSpark的設計哲學 背景:大數據問題 Spark的歷史 Spark的現狀和未來 運行Spark 第2章Spark淺析 Spark的基本架構 SparkAPI的多語言支持 SparkAPI 啟動Spark 轉換操作 動作操作 Spark用戶接口 一個完整的例子 小結 第3章Spark工具集介紹 運行生產應用程式 Dataset:類型安全的結構化API 結構化流處理 機器學習和高級...