數據清洗(2020年清華大學出版社出版的圖書)

數據清洗(2020年清華大學出版社出版的圖書)

本詞條是多義詞,共5個義項
更多義項 ▼ 收起列表 ▲

《數據清洗》是2020年清華大學出版社出版的圖書,是大數據預處理的關鍵環節。面對錯綜複雜的數據,傳統的清洗“髒”數據工作單調且異常辛苦,如果能利用正確的工具和方法,可以讓數據清洗工作變得事半功倍。該書講解數據清洗的理論知識和實際套用,全書共8章。

基本介紹

  • 中文名:數據清洗
  • 作者:黑馬程式設計師
  • 出版社:清華大學出版社
  • ISBN:9787302550877
內容簡介,圖書目錄,作者簡介,

內容簡介

數據清洗是大數據預處理的關鍵環節。面對錯綜複雜的數據,傳統的清洗“髒”數據工作單調且異常辛苦,如果能利用正確的工具和方法,可以讓數據清洗工作變得事半功倍。該書講解數據清洗的理論知識和實際套用,全書共8章: 第1章主要帶領大家簡單認識數據清洗;第2章主要講解ETL技術相關的知識;第3章講解Kettle工具的基本使用;第4章主要講解數據清洗的*步——數據抽取;第5章主要講解數據清洗與檢驗;第6章主要講解數據轉換相關的知識;第7章主要講解數據載入相關的知識;第8章利用前面章節所學的知識構建一個DVD租賃商店數據倉庫,目的是實現定期從源資料庫sakila中抽取增量數據,轉換成符合DVD租賃業務的數據,*後載入到DVD租賃商店數據倉庫中,便於後續線上DVD租賃商店的決策者對數據進行分析得出商業決策。該書附有配套視頻、原始碼、習題、教學設計、教學課件等資源。同時,為了幫助初學者更好地學習該書中的內容,還提供了線上答疑,歡迎讀者關注。
  《數據清洗/大數據技術與套用叢書》可作為高等院校本專科計算機、信息管理等相關專業的大數據課程教材,也可供相關技術人員參考,是一本適合廣大計算機編程愛好者的優秀讀物。

圖書目錄

第1章 數據清洗概述
1.1 數據清洗的背景
1.1.1 數據質量概述
1.1.2 數據質量的評價指標
1.1.3 數據質量的問題分類
1.2 數據清洗的定義
1.3 數據清洗的原理
1.4 數據清洗的基本流程
1.5 數據清洗的策略
1.6 常見的數據清洗方法
1.7 本章小結
1.8 本章習題
第2章 初識ETL

作者簡介

數據清洗是大數據預處理的關鍵環節。面對錯綜複雜的數據,傳統的清洗“髒”數據工作單調且異常辛苦,如果能利用正確的工具和方法,可以讓數據清洗工作變得事半功倍。該書講解數據清洗的理論知識和實際套用,全書共8章: 第1章主要帶領大家簡單認識數據清洗;第2章主要講解ETL技術相關的知識;第3章講解Kettle工具的基本使用;第4章主要講解數據清洗的*步——數據抽取;第5章主要講解數據清洗與檢驗;第6章主要講解數據轉換相關的知識;第7章主要講解數據載入相關的知識;第8章利用前面章節所學的知識構建一個DVD租賃商店數據倉庫,目的是實現定期從源資料庫sakila中抽取增量數據,轉換成符合DVD租賃業務的數據,*後載入到DVD租賃商店數據倉庫中,便於後續線上DVD租賃商店的決策者對數據進行分析得出商業決策。該書附有配套視頻、原始碼、習題、教學設計、教學課件等資源。同時,為了幫助初學者更好地學習該書中的內容,還提供了線上答疑,歡迎讀者關注。
  《數據清洗/大數據技術與套用叢書》可作為高等院校本專科計算機、信息管理等相關專業的大數據課程教材,也可供相關技術人員參考,是一本適合廣大計算機編程愛好者的優秀讀物。

相關詞條

熱門詞條

聯絡我們