《乾淨的數據:數據清洗入門與實踐》是人民郵電出版社出版的圖書,作者是[美] Megan Squire
基本介紹
- ISBN:9787115420473
- 作者:[美] Megan Squire
- 出版社:人民郵電出版社
- 出版時間:2016年5月
- 頁數:200
- 定價:49.00元
- 裝幀:平裝
內容簡介
數據清洗是數據挖掘與分析過程中不可缺少的一個環節,但因為數據類型極其複雜,傳統的清洗髒數據工作單調乏味且異常辛苦。如果能利用正確的工具和方法,就可以讓數據清洗工作事半功倍。 本書從檔案格式、數據類型、字元編碼等基本概念講起,通過真實的示例,探討如何提取和清洗關係型資料庫、網頁檔案和PDF文檔中的數據。最後提供了兩個真實的項目,讓讀者將所有數據清洗技術付諸實踐,完成整個數據科學過程。 如果你是一位數據科學家,或者從事數據科學工作,哪怕是位新手,只要對數據清洗有興趣,那么本書就適合你閱讀! 作者簡介: Megan Squire 依隆大學計算科學專業教授,主要教授資料庫系統、Web開發、數據挖掘和數據科學課程。有二十年的數據收集與清洗經驗。她還是FLOSSmole研究項目的領導者,致力於收集與分析數據,以便研究免費軟體、自由軟體和開源軟體的開發。 譯者簡介: 任政委 遼寧濱城大連現役程式設計師一枚,長期從事一線軟體開發工作,近年來為成為一名“思路清晰”“視角獨特”“不搞辦公室政治”“輸出有生命力代碼”“憑藉技術知識普惠國中級IT從業者”的終身制全棧式程式設計師而不懈努力。曾經翻譯《Oracle PL/SQL攻略》一書,並希望這本《乾淨的數據》能夠為奮戰在IT前線上的各界小夥伴們帶來日常工作之外的另類體驗。微信號:KNIGHTRCOM