基本介紹
- 中文名:
- 出版時間:
- 出版社:
- ISBN:
《數據分析之圖算法基於Spark和Neo4j》是2020年人民郵電出版社出版的圖書。內容簡介 圖分析可以揭示複雜系統和大規模網路的運作機制,圖算法為構建智慧型應用程式提供了快速建模的框架,有助於更準確、更快速地做出預測。包括商品推薦和欺詐檢測...
7.7 在Spark集群上使用檔案中的數據載入成為graph並進行操作 310 7.8 在Spark集群上掌握比較重要的圖操作 320 7.9 Spark GraphX圖算法 342 7.10 淘寶對Spark GraphX的大規模使用 347 第8章 Spark SQL原理與實戰 349 8.1 ...
8.4 紐約市計程車客運數據的預處理 157 8.4.1 大規模數據中的非法記錄處理 159 8.4.2 地理空間分析 162 8.5 基於Spark的會話分析 165 8.6 小結 168 第9章 基於蒙特卡羅模擬的金融風險評估 170 9.1 術語 171 9...
等等,當要處理的數據規模達到大數據等級時,就不再是單機的 R 或 Python 可以應付得來的。 Apache Spark 是一套分散式和高擴展性的數據分析系統,在大數據分析乃至於計器學習的套用上占有一席之地。為了因應數據量爆炸性的成長,Spark ...
8.5 紐約市計程車客運數據的預處理 142 8.5.1 大規模數據中的非法記錄處理 143 8.5.2 地理空間分析 147 8.6 基於Spark 的會話分析 149 8.7 小結 153 第9 章 基於蒙特卡羅模擬的金融風險評估 155 9.1 術語 156 9.2...
(類似dplyr包中的功能)這很好的解決了R的大數據級瓶頸問題。 SparkR也支持分散式的機器學習算法,比如使用MLib機器學習庫。SparkR為Spark引入了R語言社區的活力,吸引了大量的數據科學家開始在Spark平台上直接開始數據分析之旅。基本原理 ...
機器學習和高級數據分析 低級API SparkR Spark的生態系統和工具包 小結 第Ⅱ部分結構化API—DataFrame、SQL和Dataset 第4章結構化API概述 DataFrame類型和Dataset類型 Schema 結構化Spark類型概述 結構化API執行概述 小結 第5章基本的結構化...
提供探索性數據分析工具,使用筆記本進行互動式建模;最佳化數據準備和ML建模過程,利用PySpark/Python、SparkR/R和Scala工具進行大規模數據預處理和模型訓練開發。歷史榮譽 2022年11月17日,拓數派在2022年中國人力資源「天狼星」評選中榮獲 ...