基本介紹
- 中文名:數據清洗
- 外文名:Data cleaning
- 對象:數據
- 目的:發現並糾正數據檔案
《數據清洗》是2020年機械工業出版社出版的圖書,作者是黃源、塗旭東、羅少甫。本書講述了,數據清洗基礎、數據清洗方法、檔案類型、數據採集與抽取、Excel數據清洗與轉換、ETL數據清洗與轉換、Python數據清洗、R語言數據清洗。內容簡介 《數據清洗》將理論與實踐操作相結合,通過大量的案例幫助讀者快速了解和套用大數據...
《數據清洗》是2020年清華大學出版社出版的圖書,是大數據預處理的關鍵環節。面對錯綜複雜的數據,傳統的清洗“髒”數據工作單調且異常辛苦,如果能利用正確的工具和方法,可以讓數據清洗工作變得事半功倍。該書講解數據清洗的理論知識和實際套用,全書共8章。內容簡介 數據清洗是大數據預處理的關鍵環節。面對錯綜複雜的...
《數據清洗》是2018年6月清華大學出版社出版的圖書,作者是劉鵬、張燕、李法平、陳瀟瀟。內容簡介 數據清洗是大數據領域不可缺少的環節,用來發現並糾正數據中可能存在的錯誤,針對數據審查過程中發現的錯誤值、缺失值、異常值、可疑數據,選用適當方法進行“清理”,使“髒”數據變為“乾淨”數據。 本書共分為8章:...
數據清洗 《數據清洗》是2021年清華大學出版社出版的圖書,作者是黃源。
《數據清洗與ETL技術》是清華大學出版社於2022年出版的書籍,作者是馮廣、龔旭輝、周瀚章、李嘉、徐啟東、曾虎、孔立斌、石鳴鳴。內容簡介 本書為大數據時代下的產物,由淺入深地介紹大數據及其相關知識,在大數據的背景下著重介紹ETL數據處理技術,同時引入數據清洗的知識,理論與實際相結合,突出所長。在理論上,本書...
大數據清洗平台是一種用於計算機科學技術領域的分析儀器,於2016年12月12日啟用。技術指標 支持多種採購信用數據來源; 支持關係型數據表、規格化文本檔案、excel表、XML檔案等轉換為統一數據模型描述的信用數據源; 支持將政府採購信用數據從其源位置複製到目的位置,同時格式化並轉換信用數據; 支持數據有效性檢查,決定...
《R統計數據清洗及套用》是2019年清華大學出版社出版的一本圖書,作者是[荷蘭]馬克·范德魯(Mark van der Loo) 埃德溫·德榮格(Edwin de Jonge)。內容簡介 重點關注數據清洗方法的自動化,既包括理論知識,也包括使用R語言編寫的套用。使讀者能夠設計數據清洗過程,用於進行一次性分析或者設定生產系統以便定期進行...
《乾淨的數據:數據清洗入門與實踐》是人民郵電出版社出版的圖書,作者是[美] Megan Squire 內容簡介 數據清洗是數據挖掘與分析過程中不可缺少的一個環節,但因為數據類型極其複雜,傳統的清洗髒數據工作單調乏味且異常辛苦。如果能利用正確的工具和方法,就可以讓數據清洗工作事半功倍。 本書從檔案格式、數據類型...
《政務數據—第3部分:數據清洗加工規範》(DB52/T 1540.3-2020)是2020年12月20日實施的一項中華人民共和國貴州省地方標準,歸口於貴州省大數據標準化技術委員會。地方標準《政務數據—第3部分:數據清洗加工規範》(DB52/T 1540.3-2020)規定了政務數據清洗加工的術語和定義、縮略語、環境要求和過程要求。該標準...
《Python數據清洗》是清華大學出版社2022年出版的圖書,作者是[美]麥可·沃克爾。內容簡介 本書詳細闡述了與Python數據清洗相關的基本解決方案,主要包括將表格數據導入Pandas中、將HTML和JSON導入Pandas中、衡量數據好壞、識別缺失值和離群值、使用可視化方法識別意外值、使用Series操作清洗和探索數據、聚合時修復混亂數據...
《大數據清洗技術》是2020年哈爾濱工業大學出版社出版的圖書。內容簡介 本書主要介紹了大數據清洗方面的研究成果。全書共分7章,重點面向大數據清洗中計算困難、錯誤混雜、缺少知識等難題,針對實體識別、真值發現、缺失值填充、不一致檢測與修復等問題提出了相應的技術和算法,並在第7章提出了多數據質量問題綜合清洗與...
《Power Query實戰:Excel智慧型化數據清洗神器套用精講》是電子工業出版社出版圖書,作者是陳平 凝聚多年Excel使用經驗,總結常用操作使其自動化處理,除了Power Query還有更多的網路套用 內容簡介 10多個案例中融入了基礎操作、語法、函式和實戰,案例中不但有Excel案例,而且還結合了百度和高德2個開放平台的對接使用 圖書...
《基於眾包的數據清洗關鍵技術研究》是依託清華大學,由馮建華擔任項目負責人的面上項目。項目摘要 在信息化高速發展的今天,數據在各行各業發揮著越來越重要的地位,例如:數據分析常常可以幫助企業在市場上做出正確的商業決策。然而,如果數據不乾淨,那么基於髒數據所做的分析結果可能會導致完全錯誤的商業決策,給公司...
《基於網際網路海量信息的資料庫文本類型數據清洗研究》是依託蘇州大學,由李直旭擔任項目負責人的青年科學基金項目。項目摘要 在當今的知識經濟時代,如何實現大量“髒”數據的自動清洗被公認為是數據工程領域最重要且最艱巨的課題之一。以往提出的數據清洗方法往往由於缺乏足夠的信息支撐而對很多髒數據束手無策。本項目提出...
《Power Query數據清洗實戰》是2020年北京大學出版社出版的圖書。內容簡介 本書通過對多個實例的演示與講解,詳細介紹了Excel的*功能組件Power Query在數據查詢與數據轉換方面的主要功能。全書共分為8章,主要包括Power Query編輯器的基本功能,常見數據類型的查詢與導入,對原始數據進行合併、拆分、計算、轉換等數據整理...
《Python 3爬蟲、數據清洗與可視化實戰》是2018年電子工業出版社出版的圖書,作者是零一。主要內容 《Python 3爬蟲、數據清洗與可視化實戰》是一本通過實戰教初學者學習採集數據、清洗和組織數據進行分析及可視化的Python 讀物。《Python 3爬蟲、數據清洗與可視化實戰》案例均經過實戰檢驗,筆者在實踐過程中深感採集數據、...
《一種數據清洗統一方法、裝置、設備和介質》是廈門泛卓信息科技有限公司於2021年3月5日申請的專利,該專利公布號為CN112925781A,專利公布日為2021年6月8日,發明人是於文。 專利摘要 摘要 本發明提供一種數據清洗統一方法、裝置、設備和介質,包括接入智慧型建築領域涉及的各種智慧型化系統的終端設備;獲取終端設備的...
可是,目前對數據挖掘的研究主要集中於挖掘技術、挖掘算法和挖掘語言等,數據挖掘工具也主要支持數據挖掘模型建立、評價,對數據預處理的支持力度明顯不足。這和數據預處理的重要地位很不相稱。這種現象很大程度阻礙了數據挖掘效率的進一步提高。詞語簡介 數據預處理包含數據清洗、集成、轉換、和消減。數據清洗 數據清洗是指...
《查詢驅動的互動式多媒體數據清洗方法研究》是依託南京航空航天大學,由張立言擔任項目負責人的面上項目。項目摘要 網際網路、物聯網及移動網際網路的高速發展將我們帶入多媒體數據大爆炸的時代。如何準確提取語義信息並進行高效數據清洗,以支持廣泛的實際套用成為至關重要的問題。然而大數據時代下,傳統脫機模式的數據清洗...
《Python3爬蟲實戰——數據清洗、數據分析與可視化》是2019年中國鐵道出版社出版的圖書,作者是姚良。內容簡介 作為一個自學爬蟲的過來人,曾經走過很多彎路,在自學的道路上也迷茫過。每次面對一個全新的網站,都像是踏進一個未知的世界。你不知道前面有哪些反爬手段在等著你;你不知道你會踩進哪個坑裡。我做爬蟲...
《Python 3 爬蟲、數據清洗與可視化實戰(第2版)》是2020年電子工業出版社出版的圖書,作者是零一,韓要賓,黃園園。本書是一本通過實戰教初學者學習爬取數據、清洗和組織數據進行分析和可視化的Python 讀物。內容簡介 《Python 3 爬蟲、數據清洗與可視化實戰(第2版)》是一個完整大數據套用框架:從數據收集、分析...
《Power BI數據清洗與可視化互動式分析》是電子工業出版社出版的圖書。圖書簡介 本書是Power BI 快速入門工具書,筆者將Power BI 的知識點做了系統整理,並以案例的方式呈現出來,使讀者學習起來更輕鬆。全書共7 章,包括Power BI Desktop 初體驗、數據清洗的革命、數據統計和呈現、建立表關聯、互動式分析、使用DAX ...
《PowerBI數據清洗與可視化互動式分析》是2020年3月電子工業出版社出版的圖書,作者是陳劍。內容簡介 本書是Power BI 快速入門工具書,筆者將Power BI 的知識點做了系統整理,並以案例的方式呈現出來,使讀者學習起來更輕鬆。全書共7 章,包括Power BI Desktop 初體驗、數據清洗的革命、數據統計和呈現、建立表關聯、...
《Excel商務智慧型:Power Query和Power Pivot數據清洗、建模與分析實戰》是2022年10月電子工業出版社出版圖書,作者是劉必麟。緊貼實際套用場景,介紹Excel商務智慧型組件強大的數據處理和建模分析能力。針對重難點章節提供配套視頻。內容簡介 本書主要介紹Excel商務智慧型組件Power Query和Power Pivot在數...
Cleanits:製造業時序數據清洗系統 《Cleanits:製造業時序數據清洗系統》是一個技術課題,作者是丁小歐。2019年12月,獲得人民網獎學金優秀技術課題獎三等獎。作者 丁小歐(哈爾濱工業大學)。獲獎 2019年12月,“人民網獎學金優秀技術課題獎三等獎。
《交通流數據清洗與狀態辨識及最佳化控制關鍵理論方法》是2010年科學出版社有限責任公司出版的圖書,作者是王曉原、張敬磊、楊新月。內容簡介 近年來,隨著智慧型運輸系統(IntelligentTransportationSystems,簡稱ITS)的蓬勃發展,智慧型交通控制、動態的交通流狀態辨識以及實時交通流誘導成為ITS研究的熱門課題。交通流狀態辨識是ITS...
《集成噪聲數據清洗的中文UGC評論挖掘理論與方法研究》是依託哈爾濱工業大學,由蘆鵬宇擔任項目負責人的面上項目。項目摘要 隨著Web2.0時代的到來,面向UGC的評論挖掘的重要性日漸明顯。然而,現有的研究主要集中於對英文線上評論進行分析,針對中文客戶評論的相關研究仍處於起步階段。本研究將採用中國電子商務數據對中文UGC...
《excel自動化power query智慧型化數據清洗與數據建模》是2021年1月水利水電出版社出版的圖書,作者是韓小良,本書介紹了PowerQuery在數據清洗加工和自動化數據分析建模的各種實際套用,包括數據清洗加工的各種實際套用案例、表格結構轉換、表格數據整理、財務分析建模、銷售分析建模、人力資源分析建模等經典案例。內容簡介 《...