《大數據分散式計算與案例》是2016年7月中國人民大學出版社出版的圖書,作者是李豐。
基本介紹
- 中文名:大數據分散式計算與案例
- 作者:李豐
- ISBN:9787300230276
- 定價:29元
- 出版社:中國人民大學出版社
- 出版時間:2016年7月
- 裝幀:平裝
- 開本:16開
《大數據分散式計算與案例》是2016年7月中國人民大學出版社出版的圖書,作者是李豐。
《大數據分散式計算與案例》是2016年7月中國人民大學出版社出版的圖書,作者是李豐。內容簡介大數據分散式計算課程是大數據方向套用統計專業碩士學生的專業必修課,通過本課程的學習使學生能夠掌握目前大數據挖掘領域常用的並行計算...
本書分為三大部分,即分散式系統基礎理論、分散式系統常用技術以及經典的分散式系統案例分析。第一部分主要介紹分散式系統基礎理論知識,總結一些在設計分散式系統時需要考慮的範式、知識點以及可能會面臨的問題,其中包括執行緒、通信、一致性、...
《分散式計算、雲計算與大數據》是2017年機械工業出版社出版的圖書,作者是林偉偉。內容簡介 本書將傳統的分散式計算與新興的雲計算、大數據等技術綜合起來,以套用需求為背景講解技術原理和套用方法,主要內容包括:傳統分散式計算的基本原理...
5.1.2案例: 分位數回歸分散式參數估計45 5.2數值計算方法50 5.2.1隨機梯度下降算法51 5.2.2有限記憶體BFGS算法61 6自舉法65 6.1自由自舉法66 6.2子集合自舉法68 7常用大數據統計學習方法71 7.1聚類分析71 7.1.1K組中心法...
本書以實戰開發為原則,以Hadoop 3.X生態系統內的主要大數據工具整合套用及項目開發為主線,通過Hadoop大數據開發中常見的11個典型模組和3個完整項目案例,詳細介紹HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大數據工具的整合使用。本...
《分散式數據庫HBase案例教程》是清華大學出版社2022年出版的書籍,作者是陳建平 陳岸青 李金湖。內容簡介 本書定位是HBase從入門到套用的簡明教程,特色是以實戰案例為主,內容系統全面,講解深入淺出,操作步驟清晰明了。本書配套示例...
《大數據是這樣計算的:XLab實例入門》是2016年3月電子工業出版社出版的圖書,作者是楊旭 。內容簡介 隨著大數據分析方法的發展、分析工具的改進,大數據分析的門檻降低了。基於大數據算法平台,數據分析師們已經不再被數據的“大”所困擾,...
但是,當數據超過記憶體時,疊代算法變得低效或無法運行,因此,記憶體成為大數據計算的瓶頸。採用樣本的近似計算(approximate computing)是提高大數據分析能力的有效策略。但是,從分散式大數據檔案中抽取隨機樣本,特別是抽取許多小的隨機樣本集進行...
1.1.2分散式智慧型算法 1.2 Hadoop 1.2.1Hadoop環境 1.2.2HDFS分散式檔案系統分析 1.2.3 MapReduce 1.3 Spark概 1.3.1Spark環境 1.3.2 Spark型 1.4分散式智慧型算法及在大數據中的套用概述 1.4.1基於Hadoop的分散式雜交水稻...
2.3.3 特色:可擴展、可靠的分散式流式數據處理 30 2.4 其他開源流式數據處理系統 34 2.4.1 Yahoo S4 34 2.4.2 Spark Streaming 37 2.4.3 Facebook Puma 41 2.5 本章小結 42 第3章 實際案例:城市道路車輛 ...
《電力大數據套用工程技術原理與案例分析》是2019年清華大學出版社出版的圖書,作者是陳文康。內容簡介 本書基於國家電網有限公司系統SG186和SG-ERP等重大信息化工程的設計、項目建設及組織套用全 過程,總結了多項重大信息化項目的經驗,...
主要內容包括分散式檔案系統、相似性搜尋、搜尋引擎技術、頻繁項集挖掘、聚類算法、廣告管理及推薦系統。其中相關章節有對應的習題,以鞏固所講解的內容。讀者更可以從網上獲取相關拓展材料。 《大數據:網際網路大規模數據挖掘與分散式處理》...
內容新穎先進;內容涉及最新的雲計算與霧計算技術,大數據的新技術平台、新套用案例和生物信息計算示例等;知識系統全面:從傳統的經典分散式計算原理開始,系統地、深入剖析新興的雲計算、霧計算和大數據的技術原理;技術深入易學:通過大量的...
扣緊研究計畫,項目組對大數據的分散式學習算法的可行性理論做了深入的研究。在理論方面,本項目的主要研究成果包括: 基於新的誤差分解策略的分散式回歸算法的學習理論。針對高維數據的稀疏聚類方法的可行性理論。針對大規模社交網路的統計建模...
第3章 平台構建:大數據分布計算 41 3.1 分散式計算的相關概念 42 3.1.1 雲計算系統的運行概述 42 3.1.2 分散式檔案系統的數據 存儲 43 3.1.3 分散式計算系統的優勢 44 3.2 Hadoop分析技術 45 3.2.1 Hadoop的含義概述 45...
《Storm實戰:構建大數據實時計算 》是一本系統並且具有實踐指導意義的Storm工具書和參考書,對Storm整個技術體系進行了全面的講解,不僅包括對基本概念、特性的介紹,也涵蓋了一些原理說明。實戰性很強,各章節都提供了一些小案例,同時對於...
本書以Hadoop的概念、集群搭建、核心組件、實戰案例等為主線,較為全面地介紹了Hadoop大數據存儲及處理技術的相關知識。全書共10章,前9章主要講解Hadoop基礎,內容包括初識Hadoop、Hadoop的安裝與配置、高可用與聯邦、分散式檔案系統HDFS、集群...
1.3.3 商家看大數據 4 1.4 大數據的行業案例 4 1.4.1 電子地圖 4 1.4.2 電子商務——用戶畫像 5 1.5 大數據的基本概念 6 1.5.1 兩個核心 6 1.5.2 分散式存儲 6 1.5.3 分散式計算 7 1.6 大數據...
Hadoop是Apache軟體基金會發起的一個項目,在大數據分析以及非結構化數據蔓延的背景下,Hadoop受到了前所未有的關注。Hadoop是一種分散式數據和計算的框架。它很擅長存儲大量的半結構化的數據集。數據可以隨機存放,所以一個磁碟的失敗並不會...