《數據清洗與ETL技術》是清華大學出版社於2022年出版的書籍,作者是馮廣、龔旭輝、周瀚章、李嘉、徐啟東、曾虎、孔立斌、石鳴鳴。
基本介紹
- 中文名:數據清洗與ETL技術
- 作者:馮廣、龔旭輝、周瀚章、李嘉、徐啟東、曾虎、孔立斌、石鳴鳴
- 出版社:清華大學出版社
- 出版時間:2022年4月1日
- 定價:48 元
- ISBN:9787302600817
《數據清洗與ETL技術》是清華大學出版社於2022年出版的書籍,作者是馮廣、龔旭輝、周瀚章、李嘉、徐啟東、曾虎、孔立斌、石鳴鳴。
《數據清洗與ETL技術》是清華大學出版社於2022年出版的書籍,作者是馮廣、龔旭輝、周瀚章、李嘉、徐啟東、曾虎、孔立斌、石鳴鳴。內容簡介本書為大數據時代下的產物,由淺入深地介紹大數據及其相關知識,在大數據的背景下著重介紹...
ETL,是英文Extract-Transform-Load的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程。ETL一詞較常用在數據倉庫,但其對象並不限於數據倉庫。簡介 ETL是將業務系統的數據經過抽取、清洗...
數據清洗原理:利用有關技術如數理統計、數據挖掘或預定義的清理規則將髒數據轉化為滿足數據質量要求的數據。主要類型 殘缺數據 這一類數據主要是一些應該有的信息缺失,如供應商的名稱、分公司的名稱、客戶的區域信息缺失、業務系統中主表與...
該書講解數據清洗的理論知識和實際套用,全書共8章: 第1章主要帶領大家簡單認識數據清洗;第2章主要講解ETL技術相關的知識;第3章講解Kettle工具的基本使用;第4章主要講解數據清洗的*步——數據抽取;第5章主要講解數據清洗與檢驗;第...
2.3數據轉換28 2.3.1電子表格轉換29 2.3.2RDBMS數據轉換30 2.4習題30 第3章基本技術方法31 3.1ETL入門31 3.1.1ETL解決方案31 3.1.2ETL基本構成33 3.1.3ETL技術選型35 3.2技術路線35 3.2.1文本清洗路線35 3.2.2...
Zero ETL (別名:No ETL 或 0 ETL) 是由亞馬遜雲科技投入的技術方向,可以減少企業在不同服務間手動遷移或轉換數據的工作。ETL 是將業務系統的數據經過提取(Extract)、轉換清洗(Transform)和載入(Load)到數據倉庫、大數據平台的...
《數據清洗》是2020年機械工業出版社出版的圖書,作者是黃源、塗旭東、羅少甫。本書講述了,數據清洗基礎、數據清洗方法、檔案類型、數據採集與抽取、Excel數據清洗與轉換、ETL數據清洗與轉換、Python數據清洗、R語言數據清洗。內容簡介 《...
卓成數據報表分析工具是一款完全基於WEB,採用.NET架構,為企業提供輕量級報表數據填報、數據整合及數據統計的軟體,其原理是通過ETL數據清洗技術和數據集成技術,將其他業務系統方便地集成起來,最終,形成可視化圖表展示和表表分析,給企業...
縱觀目前國內一些大型項目,在數據遷移時多是採用相對成熟的ETL產品。可以看到這些項目有一些共同特點,主要包括:遷移時有大量的歷史數據、允許的宕機時間很短、面對大量的客戶或用戶、存在第三方系統接入、一旦失敗所產生的影響面將很廣。...
本書既適合大數據分析系統開發、數據倉庫系統設計與開發、DBA、架構師等相關技術人員閱讀,也適合高等院校和培訓機構人工智慧與大數據相關專業的師生參考 。目錄 第1章 ETL與Kettle 1 1.1 ETL基礎 1 1.1.1 數據倉庫架構中的ETL...
2.6 數據倉庫的粒度和聚集模型 2.6.1 數據倉庫粒度模型 2.6.2 數據倉庫聚集模型與數據分割 2.7 小結 2.8 習題 第3章 etl技術 3.1 etl相關概念 3.1.1 數據理解 3.1.2 數據抽取 3.1.3 數據清洗 3.1.4 數據轉換 3...
2.6 數據倉庫的粒度和聚集模型 2.6.1 數據倉庫粒度模型 2.6.2 數據倉庫聚集模型與數據分割 2.7 小結 2.8 習題 第3章 etl技術 3.1 etl相關概念 3.1.1 數據理解 3.1.2 數據抽取 3.1.3 數據清洗 3.1.4 數據轉換 3...
數據多源採集 多數據源採集能力,全端數據累計 開源SDK,拒絕數據採集黑盒現象 代碼埋點、全埋點、可視化埋點滿足採集需求 數據清洗治理 規範ETL流程,源頭保證數據質量 成熟數據模型,統一數據治理標準 全局統一的用戶體系 數據倉庫系統 針...
本教材包括網路數據採集、離線數據採集、數據清洗計算、數據計算派生、數據處理、在線上分析處理與決策報表套用、搜尋系統與推送報表套用共7個項目15個任務的內容,涵蓋“網路爬蟲技術與套用”“大數據ETL處理”“大數據查詢技術與套用”等專業...
任務6.1 認識數據清洗 173 6.1.1 數據清洗的定義 173 6.1.2 數據清洗的原理 173 6.1.3 數據清洗的流程 174 6.1.4 數據清洗的方法 175 6.1.5 認識ETL 180 【任務評估】 183 任務6.2 數據清洗的常用工具 ...
公司自主研發的"睿思BI"商業智慧型產品,通過ETL工具從各業務系統及企業各部門抽取業務數據,並在做清洗以後匯入數據倉庫中,通過企業數據門戶、多維分析、數據挖掘等技術將業務數據按文字播報、表格、圖表、儀錶盤等方式展現出來,讓管理者很...
主要實踐環節有:專業實習、社會調查(SAS、R語言套用)、畢業實習、多元統計課程設計、數據分析課程設計、時間序列分析課程設計、套用統計課程設計。實習實訓內容涵蓋調查分析、數據清洗、數據ETL、數據分析、商業智慧型、統計建模、資料庫設計、...