《大數據離線分析》是2017年清華大學出版社出版的圖書,作者是傅德謙、趙向兵、張林濤、劉鳴濤。
基本介紹
- 書名:大數據離線分析
- 作者:傅德謙、趙向兵、張林濤、劉鳴濤
- 出版社:清華大學出版社
- 出版時間:2017年08月01日
- 定價:35 元
- 開本:16 開
- 裝幀:平裝
- ISBN:9787302483298
《大數據離線分析》是2017年清華大學出版社出版的圖書,作者是傅德謙、趙向兵、張林濤、劉鳴濤。
《大數據離線分析》是2017年清華大學出版社出版的圖書,作者是傅德謙、趙向兵、張林濤、劉鳴濤。內容簡介本書基於開源Hadoop大數據生態圈的主流離線分析工具Hive和Pig,通過技術講解和案例實戰相結合的方式,介紹了海量...
如果沒有大數據的線上分析和處理,則無法存儲和索引數量龐大的網際網路網頁,就不會有當今的高效搜尋引擎,也不會有構建在大數據處理基礎上的微博、部落格、社交網路等的蓬勃發展。分析方法 1、列表法 將數據按一定規律用列表方式表達出來,是記錄和處理最常用的方法。表格的設計要求對應關係清楚,簡單明了,有利於發現相關...
離線計算就是在計算開始前已知所有輸入數據,輸入數據不會產生變化,且在解決一個問題後就要立即得出結果的前提下進行的計算。在大數據中屬於數據的計算部分,在該部分中與離線計算對應的則是實時計算。在離線計算中,使用 Hdfs存儲數據,使用 MapReduce 做批量計算,計算完成的數據如需數據倉庫的存儲,直接存入Hive , ...
《離線和實時大數據開發實戰》是由2018年機械工業出版社出版的圖書,作者是朱松嶺。內容簡介 本書分為三篇。第壹篇:從整體上給出數據大圖和數據平台大圖,主要介紹數據的主要流程、各個流程的關鍵技術、數據的主要從業者及他們的職責等;數據平台大圖分離線和實時分別給出數據平台架構、關鍵數據概念和技術等;第二篇:...
大數據分析是指對規模巨大的數據進行分析。大數據可以概括為5個V, 數據量大(Volume)、速度快(Velocity)、類型多(Variety)、價值(Value)、真實性(Veracity)。大數據作為時下最火熱的IT行業的辭彙,隨之而來的數據倉庫、數據安全、數據分析、數據挖掘等等圍繞大數據的商業價值的利用逐漸成為行業人士爭相追捧的利潤焦點...
Tempo大數據分析平台是美林數據技術股份有限公司研發的一款從企業數據統一管理與分發,到數據分析挖掘建模、數據可視化探索與展示等全流程數據管理、套用流程,協助企業建立數據運營完整閉環的軟體產品。主要功能 Tempo大數據分析平台由Tempo商業智慧型平台(TempoBI)、Tempo人工智慧平台(TempoAI)兩個個子產品組成。TempoBI秉承“...
《大數據平台異常檢測分析系統的若干關鍵技術研究》2020年6月電子工業出版社出版的圖書,作者是肖如良。內容簡介 大數據技術生態體系中的各類技術構件本身沒有可自省的安全機制,構件間使用的RPC協定也沒有安全機制,大數據平台的安全性面臨著巨大挑戰,如何高效、快速地檢測大數據平台中的套用異常對提高大數據平台的安全性...
《大數據Hive離線計算開發實戰》是2020年人民郵電出版社出版的圖書,作者是楊力。本書從數據處理平台資料庫和數據倉庫入手,幫助讀者逐步搭建大數據Hive數據倉庫平台,並介紹了這種傳統數據分析方法在大數據平台成功套用的典型案例。本書通過對Hive數據定義語言、Hive數據操縱語言、Hive數據基本查詢、Hive數據複雜查詢的詳細介紹...
RichData大數據智慧型分析平台,數據分析挖掘平台。產品定位 RichData從產品定位上,主要為行業大數據提供處理能力,是一個數據分析挖掘平台。因此,RichData的客戶目標定位為具備大數據場景的行業客戶。RichData作為一個大數據商業智慧型的基礎平台,以RichData作為支撐,與行業具體的解決方案結合,可以延伸出行業化的數據產品族。...
《企業級大數據項目實戰:用戶搜尋行為分析系統從0到1》項目源自真實業務場景,目的是使讀者通過實際項目來理解理論知識並提高實踐能力。本書適合缺乏大數據項目經驗的從業者閱讀,也適合作為高等院校大數據專業的教學用 書。圖書目錄 目 錄 第 1 章 項目需求描述 1 1.1 項目需求 1 1.2 項目數據流設計 2...
《Spark大數據分析——源碼解析與實例詳解》是2019年7月電子工業出版社出版的圖書,作者是劉景澤。 內容簡介 講解了網路大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化和保存海量數據的方法,學會互動、疊代和增量式分析,解決分區、數據本地化和自...
這方面的代表性工作包括pydron和SDG,二者均通過分析代碼中的標註(annotation)來獲取並行性。串列代碼的自動化並行是一個具有吸引力的方向,許多問題有待進一步解決,包括最佳化的方法、減少對串列程式的限制等。(3)混合編程 大數據處理技術的多樣化豐富了數據處理的手段,但也給實際套用帶來的困難。由於不存在全能通用的...
《Spark 3.x大數據分析實戰(視頻教學版)》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書基於Spark 3.2.x版本,從Spark核心程式語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章講解了Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解了Spark的主要組件、...
《Spark大數據分析》是2017年機械工業出版社出版的圖書,作者是穆罕默德·古勒。內容簡介 本書是關於大數據和Spark的一個簡明手冊。它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進行互動式數據分析、如何編寫Spark套用、如何在Spark中對大規模數據進行...
《Spark大數據分析技術(Python版·微課版)》是2023年清華大學出版社出版的圖書,作者是曹潔。內容簡介 本書系統介紹Spark大數據處理框架。全書共8章,內容包括大數據技術概述、Spark大數據處理框架、Spark RDD編程、Spark SQL結構化數據處理、HBase分散式資料庫、Spark Streaming流計算、Spark MLlib機器學習、數據可視化。
《Hadoop大數據分析技術》是清華大學出版社於2022年出版的書籍,作者是遲殿委、陳鵬程。內容簡介 伴隨Hadoop的成長,Hadoop不再是一個簡單的數據分散式存儲平台和工具,已經成長為一個完整的生態圈。本書採用Hadoop 3.2.2版本,系統講解Hadoop生態系統主流的大數據分析技術。本書配套示例源碼、PPT課件、教學大綱與編程環境...
《Spark快速大數據分析》是2021年人民郵電出版社出版的圖書,作者是[美] 卡勞 ( HoldenKarau )、 [美] 肯維尼斯科 ( Andy Konwinski )、[美] 溫德爾 ( PatrickWendell ) 、[加] 扎哈里亞 ( Matei Zaharia )。內容簡介 本書由 Spark 開發者及核心成員共同打造,講解了網路大數據時代應運而生的、能...
《實戰大數據》是2021年機械工業出版社出版的圖書,作者楊俊。內容簡介 《實戰大數據(Hadoop+Spark+Flink)——從平台構建到互動式數據分析(離線/實時)》詳細介紹了大數據工程師在實際工作中應該熟練掌握的大數據技術。全書共8章,分別是大數據技術概述、搭建IDEA開發環境及Linux虛擬機、基於Hadoop構建大數據平台、基於H...
《大數據分析》是2020年清華大學出版社出版的圖書,作者是黃源。內容簡介 本書的編寫目的是向讀者介紹大數據分析的基本概念和相應的技術套用。全書共10章,具體內容包括大數據、爬蟲與大數據、Scrapy爬蟲、資料庫連線與查詢、數據可視化基礎與套用、大數據存儲與清洗、數據格式與編碼技術、數據抽取與採集、pandas數據分析與...
大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)資料庫、數據挖掘、分散式檔案系統、分散式資料庫、雲計算平台、網際網路和可...
多維分析工具,提供豐富的圖形化展現界面和接口。用java語言開發支持MDX(多維表達式)的查詢語言、分析型XML和olap4j的接口技術規範。實現了從SQL和其它數據源讀取數據,在記憶體緩衝區中生成集合數據。方案價值.電信行業當前面臨的數據挑戰和新業務運營的壓力,彩訊電信大數據解決方案支持PB級數據分散式存儲,離線、實時分析...
《Flink大數據分析實戰》是2022年清華大學出版社出版的圖書,作者是張偉洋。內容簡介 本書由資深大數據專家精心編寫,循序漸進地介紹了Flink生態系統主流的大數據開發技術。全書共7章,第1章講解Flink的基礎知識,包括Flink套用場景、主要組件、編程模型等,最後通過一個單詞計數示例帶領讀者快速體驗Flink應用程式的編寫;第2...
《基於Hadoop的大數據分析和處理》是2017年電子工業出版社出版的圖書,作者是魏祖寬、劉兆宏。內容簡介 本書基於雲計算和大數據,介紹大數據處理和分析的技術,分為兩部分。第一部分介紹Hadoop基礎知識,內容包括:Hadoop的介紹和集群構建、Hadoop的分部式系統架構、MapReduce及其套用、Hadoop的版本特徵及進化。第二部分以雲...
《從零開始學Hadoop大數據分析(視頻教學版)》一書由機械工業出版社出版發行。內容簡介 本書全面介紹了Hadoop大數據分析的基礎知識、14個核心組件模組及4個項目實戰案例。為了幫助讀者高效、直觀地學習,作者特意為本書錄製了20小時同步配套教學視頻。本書共19章,分為3篇。第1篇Hadoop基礎知識,涵蓋大數據概述、Hadoop...
《大數據分析》是清華大學出版社於2020年出版的書籍。內容簡介 這是一個大數據爆發的時代。面對信息的激流,多元化數據的湧現,大數據已經為個人生活、企業經營,甚至國家與社會的發展都帶來了機遇和挑戰,大數據已經成為IT信息產業中最具潛力的藍海。圖書目錄 第1章大數據基礎1 1.1什麼是大數據4 1.1.1天文學——信息...
《大數據分析:方法與套用》是2013年9月清華大學出版社出版的圖書,作者是王星。本書介紹數據挖掘、統計學習和模式識別中與大數據分析相關的理論、方法及工具。內容簡介 理論學習的目標是使學生掌握複雜數據的分析與建模;方法學習的目標是使學生能夠按照實證研究的規範和數據挖掘的步驟進行大數據研發,工具學習的目標是使...
《大數據分析方法》是2017年07月18日中國財富出版社出版的圖書,作者是陸紅。內容簡介 本書圍繞大數據分析方法,闡述了大數據採集方法,大數據清洗方法,詳細介紹了大數據存儲方法,大數據分散式計算方法,大數據分析模型構建方法,大數據分析模型最佳化方法。全書提供了大量的案例,對程式進行了詳細的分析和解讀。本書的實用價值...
《大數據分析——基於R語言》是2020年清華大學出版社出版的圖書,作者是(印)塞瑪·阿查亞(Seema Acharya)、李媚。 內容簡介 這本書主要面向計算機科學和工程專業的本科生。同時,這本書也可供IT專業數據分析師、企業決策人員和業務分析人員參考。本書由Acharya編著,介紹了R語言作為非穩態數據分析和可視化工具的強大...
Transwarp Data Hub能夠存儲 PB 級別的數據,同時能夠提供高性能的查詢搜尋、實時分析、統計分析、預測性分析等數據分析功能,被廣泛套用在離線數據批處理、高並發的線上數據服務、數據集市、數據倉庫、數據湖、圖存儲分析、空間數據存儲、實時數據處理等各類大數據業務場景。產品優勢 創新的多模型技術架構:勝任高階數據...