《Python數據預處理技術與實踐》是清華大學出版社2019年出版的書籍。
基本介紹
- 書名:Python數據預處理技術與實踐
- 作者:白寧超、唐聃、文俊
- 出版社:清華大學出版社
- 出版時間:2019年12月1日
- 頁數:256 頁
- 定價:69
- 開本:16 開
- 裝幀:平裝
- ISBN:9787302539711
《Python數據預處理技術與實踐》是清華大學出版社2019年出版的書籍。
《Python數據預處理》是2023年清華大學出版社出版的圖書,作者是[印]羅伊·賈法裡,陳凱譯。內容簡介 《Python數據預處理》詳細闡述了與Python數據預處理相關的基本解決方案,主要包括NumPy和Pandas簡介、Matplotlib簡介、數據、資料庫、數據...
《Python數據預處理(微課版)》是2023年人民郵電出版社出版的圖書,作者是汪靜、鄭婷婷。內容簡介 本書的設計和編寫目標是培養讀者的數據思維能力和數據預處理能力,內容具有典型性和實用性,全面介紹基於Python的數據預處理的流程和技術。...
《Python數據預處理》是2021年人民郵電出版社出版的圖書。內容簡介 數據預處理是數據分析、數據挖掘或人工智慧中必不可少的環節,它通過一定的方法將存在諸多問題的低質量數據處理變成高質量數據,在一定程度上提高數據分析或數據挖掘等工作...
《數據預處理從入門到實戰:基於SQL,R,Python》是2021年人民郵電出版社出版的圖書,作者是本橋智光。 編輯推薦 一本書掌握大數據、人工智慧時代需要的數據預處理技術 ·KDD CUP 2015亞軍得主多行業實戰經驗總結;·54道例題,涵蓋常見數據...
本書主要內容包括:Python基礎語法,數據分析工具NumPy、Pandas、Matplotlib的使用,網路爬蟲庫Urllib、BeautifulSoup、Scrapy,正則表達式在網路爬蟲中的套用,數據預處理與數據分析方法、中文文本處理、文本向量化技術,以及機器學習算法在數據分析...
《Python數據處理與挖掘》是2015年機械工業出版社出版的圖書,作者是張良均、王路、譚立雲、蘇劍林。內容簡介 10餘位數據挖掘領域資深專家和科研人員,10餘年大數據挖掘諮詢與實施經驗結晶。從數據挖掘的套用出發,以電力、航空、醫療、網際網路...
2.4數據的相似性與相異性度量 2.5python操作:認識數據(一)2.6python操作:認識數據(二)03 數據預處理 課時 3.1數據預處理的基本思想 3.2數據離散化 3.3數據清洗 3.4特徵提取與特徵選擇 04 關聯規則挖掘 課時 4.1引言 4...
《Python機器學習手冊:從數據預處理到深度學習》採用基於任務的方式來介紹如何在機器學習中使用Python。書中有近200個獨立的解決 方案,針對的都是數據科學家或機器學習工程師在構建模型時可能遇到的常見任務,涵蓋從簡 單的矩陣和向量運算...
2.1 數據清洗 26 2.1.1 缺失值處理 27 2.1.2 異常值處理 28 2.2 數據集成 30 2.3 數據轉換 32 2.4 數據規約 34 2.5 Python主要數據預處理函式 35 2.6 本章小結 37 第3章 探索性數據分析 38 3.1 ...
第11章實戰案例: 電商消費者數據分析 11.1案例背景 11.2數據載入和預處理 11.2.1載入需要的庫及讀入數據 11.2.2數據信息初步分析 11.2.3數據預處理 11.3探索性數據分析 11.3.1各國訂單情況分析 11.3.2客戶情況分析 11.3...
涵蓋NumPy數值計算、Matplotlib數據可視化、pandas統計分析、使用pandas進行數據預處理、使用scikit-learn構建模型,較為全面地闡述了Python數據分析方法;第7~9章結合之前所學的數據分析技術,進行企業綜合案例數據分析。
《數據挖掘原理、方法及python套用實踐教程》系統講授數據挖掘的原理、主要方法及其Python實現,共分三部分:第一部分包含第1~2章,介紹數據挖掘的基本概念、流程和數據預處理;第二部分包含第3~11章,介紹經典的分類算法(包括樸素貝葉斯...
第一部分(第1-4章) Python數據分析與挖掘 首先介紹了Python和數據化運營的基本知識,然後詳細講解了Python數據獲取(結構化和非結構化)、預處理、分析和挖掘的關鍵技術和經驗,包含10大類預處理經驗、14個數據分析與挖掘主題,50餘個...
13.2.3 配置缺失值處理組件 332 13.2.4 配置記錄選擇組件 334 13.2.5 配置數據標準化組件 334 13.2.6 配置K-Means組件 336 13.3 小結 339 作者簡介 張良均 資深大數據挖掘與分析專家、模式識別專家、AI技術專家。有10餘...
《Python中文自然語言處理基礎與實戰》是2022年人民郵電出版社出版的圖書。內容簡介 本書以Python自然語言處理的常用技術與真實案例相結合的方式,深入淺出地介紹Python自然語言處理的重要內容。全書共12章,內容包括緒論、語料庫、正則表達式...
本書作為數據挖掘和機器學習的讀物,基於真實數據集進行案例實戰,使用Python數據科學庫,從數據預處理開始一步步介紹數據建模和數據挖掘的過程。書中主要介紹了數據挖掘的基礎知識、基本工具和實踐方法,通過循序漸進地講解算法,帶領讀者輕鬆...
4.3 數據歸約 91 4.3.1 屬性歸約 91 4.3.2 數值歸約 95 4.4 Python主要數據預處理函式 98 4.5 小結 101 第5章 挖掘建模 102 5.1 分類與預測 102 5.1.1 實現過程 103 5.1.2 常用的分類與預測算法 103 5...
9.2.4Python生成候選項集 9.3FPGrowth算法 9.3.1用FP樹編碼數據集 9.3.2從FP樹中挖掘頻繁項 9.3.3從新聞網站點擊流中挖掘 9.4小結 9.5習題 第10章Python數據預處理 10.1概述 10.1.1為什麼要對數據預處理 10.1.2...
第一部分(第1~4章):Python數據分析和挖掘 著重講解了Python和數據化運營的基本知識,以及Python數據獲取(結構化和非結構化)、預處理、分析和挖掘的關鍵技術和經驗。包含11條數據預處理經驗、39個數據預處理知識點、14個數據分析和...
1.1.2 大數據處理的過程2 1.1.3 大數據的職業崗位4 1.2 雲計算—大數據的處理架構4 1.2.1 雲計算的定義和特點4 1.2.2 雲計算的體系結構6 1.2.3 雲計算的分類7 1.2.4 虛擬化技術9 1.3 Hadoop大數據處理平台11 1...
第5章數值數據智慧型分析技術 實驗5.1NumPy庫的基礎操作 實驗5.2Pandas庫的基礎操作 實驗5.3Matplotlib庫的畫圖基礎 第6章文本數據智慧型分析技術 實驗6.1文本數據的爬取 實驗6.2文本數據的預處理 實驗6.3中文分詞 實驗6.4詞性標註 實...
3.2.1 基於Python的網頁採集框架Scrapy 69 3.2.2 日誌收集工具Flume 74 3.3 數據屬性的類型 79 3.3.1 “屬性”的類型 79 3.3.2 屬性類型的轉換 80 3.4 數據預處理 80 3.4.1 數據變換 81 3.4.2 數據清洗 84 3.4...
《Python數據挖掘與機器學習》是清華大學出版社出版的圖書。內容簡介 《Python數據挖掘與機器學習》主要介紹數據挖掘與機器學習的基本概念和方法,包括數據預處理、Python數據挖掘與可視化基礎、關聯規則挖掘、回歸分析、分類、聚類、神經網路...
在學習完第1~5章的Python基礎知識以及第6和7章的一些關鍵內容之後,讀者將能夠處理第11~16章中有關人工智慧案例的重要實操內容,包括自然語言處理,用於情感分析的Twitter數據挖掘,使用IBM Watson 的認知計算,利用分類和回歸進行的有監督...
雖然在介紹技術理論時我們可以做出許多很強的假設,比如數據都是連續型數據、各個特徵的取值都很合理,以及訓練步數可以控制在最優等,但對於真實世界中的數據集而言,我們往往需要做很多預處理工作之後,才能夠套用諸多(神經網路的)技術...
8.1.2 自然語言處理技術簡介 232 8.2 套用案例:基於Encoder-Decoder模型的機器翻譯 239 8.2.1 Encoder-Decoder模型介紹 239 8.2.2 訓練數據準備 240 8.2.3 數據預處理 241 8.2.4 模型創建 243 8.2.5 模型...
1.1.4 Python的優勢 5 1.2 基本概念 6 1.2.1 機器學習的種類 6 1.2.2 有監督學習 6 1.2.3 無監督學習 7 1.2.4 機器學習的術語 8 1.2.5 預處理 9 1.3 Numpy數據格式 10 1.3.1 標稱數據 10 ...