《大數據分析——數據倉庫項目實戰》是2020年9月電子工業出版社出版的圖書,作者是尚矽谷IT教育。
基本介紹
- 中文名:大數據分析——數據倉庫項目實戰
- 別名:數據倉庫項目實戰
- 作者:尚矽谷IT教育
- 出版時間:2020年9月
- 出版社:電子工業出版社
- 頁數:396 頁
- ISBN:9787121396007
- 定價:100 元
- 開本:16 開
《大數據分析——數據倉庫項目實戰》是2020年9月電子工業出版社出版的圖書,作者是尚矽谷IT教育。
《大數據分析——數據倉庫項目實戰》是2020年9月電子工業出版社出版的圖書,作者是尚矽谷IT教育。內容簡介本書按照需求規劃、需求實現、需求可視化的流程進行編排,遵循項目開發的實際流程,全面介紹了數據倉庫的搭建過程。在整個...
大數據分析是指對規模巨大的數據進行分析。大數據可以概括為5個V, 數據量大(Volume)、速度快(Velocity)、類型多(Variety)、價值(Value)、真實性(Veracity)。大數據作為時下最火熱的IT行業的辭彙,隨之而來的數據倉庫、數據安全、數據...
《Hadoop數據倉庫實戰》是2019年12月人民郵電出版社出版的圖書,作者是肖睿、蘭偉、廖春瓊。內容簡介 本書以Hive為開發平台,主要介紹了如何使用HiveQL來查詢和分析存儲在Hadoop分散式檔案系統上的大數據集合,具體內容包括Hive入門、Hive數據...
Disney在該項目中所使用的一些產品包括SAS分析軟體和Teradata數據倉庫技術。最新的集中式ERP、數據倉庫和分析系統正幫助Disney更好地管理存貨、分析銷售額和預報特定領域的商品需求。構造設計 數據倉庫具有改變業務的威力。它能幫助公司深入了解...
《大數據項目實戰/大數據技術與套用叢書》講解了一個大數據綜合項目——招聘網站職位分析。全書共分為6章,內容分別是項目概述、搭建大數據集群環境、數據採集、數據預處理、數據分析與數據可視化。《大數據項目實戰/大數據技術與套用叢書》附有...
1.2 Hadoop的項目 2 1.3 Hadoop的體系結構 4 1.4 Hadoop與分散式開發 5 1.5 Hadoop計算模型 8 1.6 Hadoop的數據管理 8 1.6.1 HDFS的數據管理 8 1.6.2 HBase的數據管理 10 1.6.3 Hive的數...
第5~6章主要講解大數據環境中常見的輔助系統,HBase資料庫以及Kafka流處理平台,包含輔助系統的搭建方式、使用方法以及相關底層實現的基本原理;第9章是一個綜合項目,利用Spark框架開發流式計算系統。掌握Spark相關技術,能夠很好地適應企業...
直到現在,大數據在政府決策部門、行業企業、研究機構等得到了廣泛的套用,並實際創造了價值。大數據分析相比於傳統的數據倉庫套用,具有數據量大、查詢分析複雜等特點。本書對大數據技術的發展進行了總結,試圖講清楚數據獲取,數據結構,數據...
第14章 旅遊酒店評價分析項目實戰 266 14.1 項目介紹 266 14.2 項目需求及分析 267 14.2.1 數據集需求 267 14.2.2 功能需求 267 14.3 詳細實現 268 14.3.1 數據集上傳到HDFS 269 14.3.2 Spark數據清洗 271...
從而獲得大數據項目開發經驗。《實戰大數據(Hadoop+Spark+Flink)——從平台構建到互動式數據分析(離線/實時)》既可以作為大數據工程師的必備開發手冊,也可以作為高校大數據及相關專業的教材或實驗手冊。
生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式檔案系統、MapReduce計算框架、資源管理調度框架YARN 、Hive數據倉庫、數據遷移工具Sqoop、分散式資料庫HBase、ZooKeeper分散式協調服務、準實時分析系統Impala...
出版學術專著兩本,並出版國內首部《大數據算法》教材。獲得黑龍江省自然科學一等獎和教育部高等學校科技進步一等獎各一項。先後主持或參與國家973項目、863項目、自然科學基金重點項目等。主要社會兼職有ACM SIGMOD中國秘書長,中國計算機學會學術...