《Python數據預處理技術與實踐》是一本圖書,作者是白寧超、唐聃、文俊。
基本介紹
- 中文名:Python數據預處理技術與實踐
- 作者:白寧超、唐聃、文俊
- 出版社:清華大學出版社
- 定價:69 元
- ISBN:9787302539711
《Python數據預處理技術與實踐》是一本圖書,作者是白寧超、唐聃、文俊。
《Python數據預處理》是2023年清華大學出版社出版的圖書,作者是[印]羅伊·賈法裡,陳凱譯。內容簡介 《Python數據預處理》詳細闡述了與Python數據預處理相關的基本解決方案,主要包括NumPy和Pandas簡介、Matplotlib簡介、數據、資料庫、數據...
《Python數據預處理》是2021年人民郵電出版社出版的圖書。內容簡介 數據預處理是數據分析、數據挖掘或人工智慧中必不可少的環節,它通過一定的方法將存在諸多問題的低質量數據處理變成高質量數據,在一定程度上提高數據分析或數據挖掘等工作...
《Python數據預處理(微課版)》是2023年人民郵電出版社出版的圖書,作者是汪靜、鄭婷婷。內容簡介 本書的設計和編寫目標是培養讀者的數據思維能力和數據預處理能力,內容具有典型性和實用性,全面介紹基於Python的數據預處理的流程和技術。...
《數據預處理從入門到實戰:基於SQL,R,Python》是2021年人民郵電出版社出版的圖書,作者是本橋智光。 編輯推薦 一本書掌握大數據、人工智慧時代需要的數據預處理技術 ·KDD CUP 2015亞軍得主多行業實戰經驗總結;·54道例題,涵蓋常見數據...
2.1.2 異常值處理 28 2.2 數據集成 30 2.3 數據轉換 32 2.4 數據規約 34 2.5 Python主要數據預處理函式 35 2.6 本章小結 37 第3章 探索性數據分析 38 3.1 異常值分析 38 3.2 缺失值分析 41 3.3 ...
1.4 數據挖掘流程 9 1.4.1 明確目標 9 1.4.2 數據收集 9 1.4.3 數據探索 10 1.4.4 數據預處理 10 1.4.5 挖掘建模 10 1.4.6 模型評價 11 1.5 數據挖掘常用工具及其比較 11 1.5.1 Python 11 1.5.2 R 11 ...
本書主要內容包括:Python基礎語法,數據分析工具NumPy、Pandas、Matplotlib的使用,網路爬蟲庫Urllib、BeautifulSoup、Scrapy,正則表達式在網路爬蟲中的套用,數據預處理與數據分析方法、中文文本處理、文本向量化技術,以及機器學習算法在數據分析...
涵蓋NumPy數值計算、Matplotlib數據可視化、pandas統計分析、使用pandas進行數據預處理、使用scikit-learn構建模型,較為全面地闡述了Python數據分析方法;第7~9章結合之前所學的數據分析技術,進行企業綜合案例數據分析。
9.2.4Python生成候選項集 9.3FPGrowth算法 9.3.1用FP樹編碼數據集 9.3.2從FP樹中挖掘頻繁項 9.3.3從新聞網站點擊流中挖掘 9.4小結 9.5習題 第10章Python數據預處理 10.1概述 10.1.1為什麼要對數據預處理 10.1.2...
《Python機器學習手冊:從數據預處理到深度學習》採用基於任務的方式來介紹如何在機器學習中使用Python。書中有近200個獨立的解決 方案,針對的都是數據科學家或機器學習工程師在構建模型時可能遇到的常見任務,涵蓋從簡 單的矩陣和向量運算...
1.3數據挖掘的套用 1.4python介紹 02 認識數據 課時 2.1數據對象與屬性類型 2.2數據的基本統計描述 2.3數據可視化 2.4數據的相似性與相異性度量 2.5python操作:認識數據(一)2.6python操作:認識數據(二)03 數據預處理 課...
第2章商務智慧型中的核心技術〈〈〈16 2.1數據預處理16 2.1.1數據預處理概述16 2.1.2數據預處理的必要性16 2.1.3數據預處理的基本方法17 2.1.4數據清洗17 2.1.5數據集成21 2.1.6數據變換22 2.1.7數據歸約30 2.2...
本書作為數據挖掘和機器學習的讀物,基於真實數據集進行案例實戰,使用Python數據科學庫,從數據預處理開始一步步介紹數據建模和數據挖掘的過程。書中主要介紹了數據挖掘的基礎知識、基本工具和實踐方法,通過循序漸進地講解算法,帶領讀者輕鬆...
4.3 數據歸約 91 4.3.1 屬性歸約 91 4.3.2 數值歸約 95 4.4 Python主要數據預處理函式 98 4.5 小結 101 第5章 挖掘建模 102 5.1 分類與預測 102 5.1.1 實現過程 103 5.1.2 常用的分類與預測算法 103 5...
1.4.1 預處理—整理數據 6 1.4.2 訓練和選擇預測模型 7 1.4.3 評估模型和預測新樣本數據 7 1.5 用Python進行機器學習 7 1.5.1 從Python包索引安裝Python和其他包 8 1.5.2 採用Anaconda Python和軟體包管理器 8 1...
本書共12章,內容包括機器學習、機器學習的數學基礎、不同格式數據的讀取與寫入、數據預處理、回歸、決策樹分類、貝葉斯分類、支持向量機分類、聚類、人工神經網路、OpenCV圖像識別、TensorFlow深度學習。 本書可作為高等院校計算機、人工智慧、...
13.2.3 配置缺失值處理組件 332 13.2.4 配置記錄選擇組件 334 13.2.5 配置數據標準化組件 334 13.2.6 配置K-Means組件 336 13.3 小結 339 作者簡介 張良均 資深大數據挖掘與分析專家、模式識別專家、AI技術專家。有10餘...
第11章實戰案例: 電商消費者數據分析 11.1案例背景 11.2數據載入和預處理 11.2.1載入需要的庫及讀入數據 11.2.2數據信息初步分析 11.2.3數據預處理 11.3探索性數據分析 11.3.1各國訂單情況分析 11.3.2客戶情況分析 11.3...
413數據變換 4.3.1簡單函式變換 4.3.2規範化 4.3.3連續屬性離散化 4.3.4屬性構造 4.3.5小波變換 4.4數據規約 4.4.1屬性規約 4.4.2數值規約 4.5 Python主要數據預處理函式 4.6小結 第5章挖掘建模 5.1分類與預測 5...
學完本書,讀者能掌握 Python 的基本語法和 Jupyter Notebook 的使用方法,數據預處理知識,NumPy、pandas、Matplotlib 和 scikit-learn 等軟體庫的使用方法,以及利用現有算法實現機器學習的方法。另外,對網路爬蟲、自然語言處理和圖像數據...
1.1.2 大數據處理的過程2 1.1.3 大數據的職業崗位4 1.2 雲計算—大數據的處理架構4 1.2.1 雲計算的定義和特點4 1.2.2 雲計算的體系結構6 1.2.3 雲計算的分類7 1.2.4 虛擬化技術9 1.3 Hadoop大數據處理平台11 1...
本書適合各個行業自然語言處理方向的技術人員閱讀學習,也適合開設自然語言處理課程的院校師生及計算機專業教學參考使用。目錄 第1章 數據類型 001 1.1 搜尋 002 1.2 評論 003 1.3 社交媒體中的帖子/部落格 005 1.4 聊天數據 006 1...
12.1技術要求246 12.2什麼是機器學習246 12.2.1監督學習與無監督學習247 12.2.2模型驗證247 12.3scikitlearn的基礎知識249 12.3.1訓練模型和預測249 12.3.2使用pipeline連結預處理器和估計器251 12.3.3通過交叉驗證驗證模型...
1.1.4 Python的優勢 5 1.2 基本概念 6 1.2.1 機器學習的種類 6 1.2.2 有監督學習 6 1.2.3 無監督學習 7 1.2.4 機器學習的術語 8 1.2.5 預處理 9 1.3 Numpy數據格式 10 1.3.1 標稱數據 10 ...
3.2.1 基於Python的網頁採集框架Scrapy 69 3.2.2 日誌收集工具Flume 74 3.3 數據屬性的類型 79 3.3.1 “屬性”的類型 79 3.3.2 屬性類型的轉換 80 3.4 數據預處理 80 3.4.1 數據變換 81 3.4.2 數據清洗 84 3.4...
楊游雲,資深數據分析專家和AI技術專家,在廣告領域工作多年,目前就職於微思敦深圳分公司皓量科技。在AI技術領域有非常深厚的積累,擅長機器學習和自然語言處理,對圖像識別技術也有一定的研究。個人微信公眾號:數據挖掘與AI算法。周健,...
8.1.2 自然語言處理技術簡介 232 8.2 套用案例:基於Encoder-Decoder模型的機器翻譯 239 8.2.1 Encoder-Decoder模型介紹 239 8.2.2 訓練數據準備 240 8.2.3 數據預處理 241 8.2.4 模型創建 243 8.2.5 模型...
第3章無監督學習與數據預處理 3.1無監督學習 3.1.1無監督學習的類型 3.1.2無監督學習的挑戰 3.2數據預處理 3.2.1數據清洗 3.2.2數據變換 3.2.3數據集成 3.2.4數據規約 3.3降維 3.3.1數據壓縮 3.3.2數據可視化 3...