每章都設計了案例研究,以機器學習算法為主線,結合實例探討了Spark 的實際套用。書中沒有讓人抓狂的數據公式,而是從準備和正確認識數據開始講起,全面涵蓋了推薦系統、回歸、聚類、降維等經典的機器學習算法及其實際套用。
基本介紹
- 書名:Spark機器學習
- ISBN:978-7-115-39983-0
- 出版社:人民郵電出版社
- 開本:16開
- 正文語種:中文
- 包裝:平裝
- 用紙:膠版紙
- 叢書名:圖靈程式設計叢書
每章都設計了案例研究,以機器學習算法為主線,結合實例探討了Spark 的實際套用。書中沒有讓人抓狂的數據公式,而是從準備和正確認識數據開始講起,全面涵蓋了推薦系統、回歸、聚類、降維等經典的機器學習算法及其實際套用。
每章都設計了案例研究,以機器學習算法為主線,結合實例探討了Spark 的實際套用。書中沒有讓人抓狂的數據公式,而是從準備和正確認識數據開始講起,全面涵蓋了推薦系統...
《Spark MLlib機器學習實踐》是2015年清華大學出版社出版的圖書,作者是王曉華。...... 《Spark MLlib機器學習實踐》是2015年清華大學出版社出版的圖書,作者是王曉華...
《Python+Spark 2.0+Hadoop機器學習與大數據實戰》是2018年1月1日清華大學出版社出版的圖書,作者是林大貴。...
《Spark MLlib機器學習:算法、源碼及實戰詳解》是2016年4月電子工業出版社出版的圖書,作者是黃美靈。...
MapReduce所具有的優點;但不同於MapReduce的是——Job中間輸出結果可以保存在記憶體中,從而不再需要讀寫HDFS,因此Spark能更好地適用於數據挖掘與機器學習等需要疊代的...
《Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰》是於2017年1月清華大學出版社出版的一本圖書,作者是林大貴...
四位作者首先結合數據科學和大數據分析的廣闊背景講解了Spark,然後介紹了用Spark和Scala進行數據處理的基礎知識,接著討論了如何將Spark用於機器學習,同時介紹了常見套用...
可以高效的處理流式數據;第8章介紹了Spark GraphX,可以高效的處理圖數據;第9章和第10章介紹了Spark ML,分別以Spark機器學習原理和Spark機器學習模型為重點進行介紹...
8.1 Spark MLlib概述 1878.1.1 機器學習介紹 1878.1.2 Spark MLlib簡介 1898.2 MLlib向量與矩陣 1908.2.1 MLlib向量 190...
《Spark快速大數據分析》是2015年人民郵電出版社出版的圖書,作者是[美] 卡勞 (...第11章 基於MLlib的機器學習 18711.1 概述 18711.2 系統要求 188...
Spark全棧數據分析內容簡介 編輯 本書介紹了作者提出的敏捷數據科學的方法論,結合...使用scikit-learn與Spark MLlib進行機器學習 ...58使用Apache Airflow(孵化項目...
1.3.1 圖計算框架Spark GraphX 28 1.3.2 實時流處理框架(Spark Streaming) 41 1.3.3 互動式SQL處理框架Spark SQL 46 1.3.4 機器學習框架(Spark MLlib...
擴展篇(第8~11章),主要講解基於Spark核心的各種擴展及套用,包括SQL處理引擎、Hive處理、流式計算框架Spark Streaming、圖計算框架GraphX、機器學習庫MLlib等內容。...
《Spark MLlib機器學習實踐(第2版)》是2017年3月1日出版的圖書,作者是王曉華。...... 《Spark MLlib機器學習實踐(第2版)》是2017年3月1日出版的圖書,作者是...
人工智慧和大數據時代,解決最有挑戰性問題的主流方案是分散式機器學習!《分散式機器學習:算法、理論與實踐》旨在全面介紹分散式機器學習的現狀,深入分析其中的核心技術...
《機器學習實踐套用》是人民出版社於2017年7月出版的圖書,作者李博。書中通過將機器學習算法與實際業務場景結合,讓讀者可以快速入門並使用高深的算法。在本書中,對...
前5章為基礎內容,即使讀者對Spark、GraphX、Scala不熟悉,也能快速上手;後5章為圖計算進階,主要是圖算法和機器學習算法的相關內容。專門講圖計算的書很少,《Spark...
曾參與開發設計多款面向校園服務的App,參與開發設計過多個基於Hadoop、Spark平台的大數據套用,有著豐富的流數據、結構化數據處理經驗,現主要研究方向為機器學習、數據...
1. spark .apache[引用日期2017-02-10] 2. Nick Pentreath.Spark機器學習:人民郵電出版社,2015-09-01 3. [美] 卡勞.Spark快速大數據分析:人民郵電出版社,...
2. Nick Pentreath.Spark機器學習:人民郵電出版社,2015-09-01V百科往期回顧 詞條統計 瀏覽次數:次 編輯次數:6次歷史版本 最近更新: 金牌丁當 猜...
KFold 是 sklearn 包中用於交叉驗證的函式。在機器學習中,樣本量不充足時,通常使用交叉訓練驗證。...
8.6.3SparkSQL8.6.4SparkStreaming8.6.5Spark機器學習8.7阿里雲大數據平台8.7.1飛天系統8.7.2大數據集成平台思考題第4部分綜合套用...