《Python數據清洗》是清華大學出版社2022年出版的圖書,作者是[美]麥可·沃克爾。
基本介紹
- 中文名:Python數據清洗
- 作者:[美]麥可·沃克爾
- 譯者:劉亮
- 出版社:清華大學出版社
- 出版時間:2022年7月1日
- 定價:119 元
- ISBN:9787302609360
《Python數據清洗》是清華大學出版社2022年出版的圖書,作者是[美]麥可·沃克爾。
7.1 Python數據清洗基礎 7.1.1 Python語言基礎 7.1.2 Python數據清洗所用庫 7.2 數據讀寫、選擇、整理和描述 7.2.1 從CSV檔案讀取數據 7.2.2 寫入數據到CSV檔案 7.2.3 數據整理和描述 7.3 數據分組、分割、合併和變形 7.3.1 數據分組 7.3.2 數據分割 7.3.3 數據合併 7.3.4 數據變形 7....
1.1 安裝Python 環境 1 1.1.1 Python 3.6.2 安裝與配置 1 1.1.2 使用IDE 工具——PyCharm 4 1.1.3 使用IDE 工具——Anaconda 4 1.2 Python 操作入門 5 1.2.1 編寫第一個Python 代碼 5 1.2.2 Python 基本操作 . 8 1.2.3 變數 . 10 1.3 Python 數據類型 . 10 1.3.1 ...
4.2.4 插入和更新數據庫 59 4.2.5 爬取數據並插入到MongoDB資料庫中 60 4.3 Redis資料庫 60 4.3.1 Redis安裝 60 4.3.2 連線Redis資料庫 61 4.3.3 Python操作Redis資料庫 61 4.3.4 爬取並寫入Redis做快取 62 第5章 效率為王——分散式爬蟲 5.1 什麼是分散式爬蟲 64 5.1.1 分散式爬蟲的...
3.1 Python數據清洗基礎 67 3.1.1 Python函式與模組 67 3.1.2 numpy模組數組 74 3.1.3 pandas模組序列 79 3.1.4 pandas模組數據框 81 3.1.5 Python流程控制語句 86 3.2 Python數據讀取、合併、寫入 90 3.2.1 讀取、合併、寫入文本檔案(CSV或者TXT) 90 3.2.2 讀取、合併、寫入...
2.2Python介紹 2.2.1Python開發環境搭建 2.2.2編寫Python程式 2.2.3Python數據類型 2.3爬蟲相關知識 2.3.1了解網頁結構 2.3.2Python與爬蟲 2.3.3基礎爬蟲框架 2.4利用爬蟲抓取網頁內容 2.4.1觀察與分析頁面 2.4.2抓取過程分析 2.4.3獲取頁面內容 2.5本章小結 2.6實訓 習題 第3章Scrapy爬蟲 3...
《Python數據處理》是2017年人民郵電出版社出版的圖書,作者是傑奎琳·凱澤爾凱 瑟琳?賈繆爾。內容簡介 本書採用基於項目的方法,介紹用Python完成數據獲取、數據清洗、數據探索、數據呈現、數據規模化和自動化的過程。主要內容 包括:Python基礎知識,如何從CSV、Excel、XML、JSON和PDF檔案中提取數據,如何獲取與存儲數據,...
7.2.2數據清洗 7.2.3數據分析 7.2.4數據可視化 作者簡介 夏正東,十餘年一線軟體開發經驗,長期從事於Web系統、GUI開發框架以及數據分析等領域的研發和教學工作,精通Python、PHP、Web前端以及Linux等技術,曾就職於東軟、金山以及電訊盈科等公司,並在遼寧部分高校和企業擔任外聘計算機講師和資深企培講師等職務...
《Python數據分析》是2024年清華大學出版社出版的圖書,作者是[英] 羅布·馬斯特羅多梅尼科(Rob Mastrodomenico),譯者是宋廷強。內容簡介 《Python數據分析》為新手打開了數據處理的大門。作者是一位經驗豐富的數據科學家和Python程式設計師,他將自身的實踐經驗和專業知識傾注於筆端,幫助讀者理解並掌握Python這一強大的編程...
《Python數據預處理》是2023年清華大學出版社出版的圖書,作者是[印]羅伊·賈法裡,陳凱譯。內容簡介 《Python數據預處理》詳細闡述了與Python數據預處理相關的基本解決方案,主要包括NumPy和Pandas簡介、Matplotlib簡介、數據、資料庫、數據可視化、預測、分類、聚類分析、數據清洗、數據融合與數據集成、數據歸約、數據轉換...
全書共8個單元,單元1介紹數據預處理的基礎知識,單元2介紹Python數據預處理的庫pandas的用法及主要數據對象的用法,單元3~單元7依次介紹數據預處理流程中數據獲取、數據合併、數據清洗、數據變換和數據描述等相關知識和技術。為突出培養讀者的動手能力,本書單元2~單元7都配套了任務實踐和拓展實訓,除單元8,每個單元...
4.2.2利用Pandas進行數據清洗 4.3數據集成 4.3.1數據集成過程中的關鍵問題 4.3.2利用Pandas合併數據 4.4數據標準化 4.4.1離差標準化數據 4.4.2標準差標準化數據 4.5數據歸約 4.5.1維歸約 4.5.2數量歸約 4.5.3數據壓縮 4.6數據變換與數據離散化 4.6.1數據變換的策略 4.6.2Python數據變換...
3.1.4數據之間的關聯58 3.2數據清洗59 3.2.1數據清洗的主要內容59 3.2.2數據清洗研究現狀60 3.2.3數據清洗的必要性61 3.2.4數據清洗的問題61 3.2.5數據清洗對工具的要求62 3.2.6數據清洗的流程62 3.2.7數據清洗的原理63 3.2.8數據清洗的方法63 3.3Python下的數據清洗65 3.3.1Python概述65...
《Python數據分析從入門到精通(第2版)》是2023年清華大學出版社出版的圖書,作者是明日科技。內容簡介 《Python數據分析從入門到精通(第2版)》從數據分析初學者角度出發,以通俗易懂的語言、豐富多彩的實例,詳細介紹了使用Python進行數據分析程式開發應掌握的各方面技術。全書共分21章,包括數據分析基礎、搭建數據...
《Python大數據處理與分析》是2021年人民郵電出版社出版的圖書。內容簡介 本書介紹利用Python進行大數據處理與分析的詳細方法和步驟。全書共9章,主要內容包括搭建開發環境、Numpy庫、Pandas庫、Matplotlib庫、數據預處理以及多個案例分析。本書注重理論緊密聯繫實際,使讀者可以系統、全面地了解Python大數據處理與分析的實用...
《Python數據分析從入門到精通》全面介紹了使用Python進行數據分析所必需的各項知識。全書共分為14章,包括了解數據分析、搭建Python數據分析環境、Pandas統計分析、Matplotlib可視化數據分析圖表、Seaborn可視化數據分析圖表、第三方可視化數據分析圖表Pyecharts、圖解數組計算模組NumPy、數據統計分析案例、機器學習庫Scikit-Learn、...
《Python大數據分析與可視化》是2023年清華大學出版社出版的圖書,作者是李輝、倪健。內容簡介 本書全面介紹了使用Python進行數據分析所必需的各項知識,全書共分為14章,包括數據分析與可視化概述、Python編程基礎、NumPy數組計算、Pandas基礎知識、Pandas數據獲取與清洗、Pandas數據形式變化、Pandas數據分析與可視化、Pandas數據...
《Python數據預處理技術與實踐》是清華大學出版社2019年出版的書籍。內容簡介 本書基礎理論和工程套用相結合,循序漸進地介紹了數據預處理的基本概念、基礎知識、工具套用和相關案例,包括網路爬蟲、數據抽取、數據清洗、數據集成、數據變換、數據向量化、數據規約等知識,書中針對每個知識點,都給出了豐富的教學實例和實現...
《Python數據分析快速上手》是2024年清華大學出版社出版的圖書,作者是王靖、商艷紅、張洪波、盧軍。內容簡介 《Python數據分析快速上手》通過通俗易懂的語言、豐富多彩的實例,詳細介紹了使用Python進行數據分析應該掌握的各方面技術。本書內容包括Python基礎,用NumPy進行數據計算,用Pandas進行數據分析,用SciPy進行數據...
《Python深度學習套用》是2020年清華大學出版社出版的圖書,作者是(加)亞歷克斯·蓋利(Alex Galea)、(古)路易斯·卡佩羅(Luis Capelo)、高凱、吳林芳、李嬌娥、朱玉。內容簡介 本書介紹Jupyter、數據清洗、高級機器學習、網頁爬蟲、互動式可視化、神經網路、深度學習、模型構建、模型評估與最佳化、產品化處理等有...
Python環境搭建與使用 NumPy入門和實戰 pandas入門和實戰 外部數據的讀取與存儲 數據清洗與整理 數據分組與聚合 matplotlib可視化 seaborn可視化 pyecharts可視化 時間序列 作者簡介 羅攀 知名論壇Python爬蟲專題管理員。擅長Python爬蟲、Python數據分析與挖掘等技術。曾經在CSDN等多個知名部落格網站發表多篇技術文章,深受讀者...
《Python數據分析與大數據處理從入門到精通》主要講解數據分析與大數據處理所需的技術、基礎設施、核心概念、實施流程。從程式語言準備、數據採集與清洗、數據分析與可視化,到大型數據的分散式存儲與分散式計算,貫穿了整個大數據項目開發流程。本書輕理論、重實踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語法、...
《Python財務數據分析及套用》共分9章,具體內容如下:第1章為人工智慧與會計;第2章為數據分析基礎;第3-6章圍繞財務數據分析的整個流程展開,包括用Python進行數據的讀取和保存、清洗和加工、數據可視化,以及對清洗後的財務數據進行數據挖掘與分析;第7章是會計文本分析與詞雲圖繪製;第8章是會計業務智慧型化處理,...
這既是一本能帶領讀者零基礎快速掌握Python數據分析方法與流程的工具書,又是一本從電商出發指導讀者解決各類數據分析問題的實用指南。 首先,本書以Python數據分析中使用率極高的Pandas為切入點,注重對數據分析思維和技能的培養,詳細講解了Pandas的操作以及數據分析的方法,可覆蓋80%以上的數據分析套用場景,為數據分析師打...
4.2.2利用Pandas進行數據清洗 4.3數據集成 4.3.1數據集成過程中的關鍵問題 4.3.2利用Pandas合併數據 4.4數據標準化 4.4.1離差標準化數據 4.4.2標準差標準化數據 4.5數據歸約 4.5.1維歸約 4.5.2數量歸約 4.5.3數據壓縮 4.6數據變換與數據離散化 4.6.1數據變換的策略 4.6.2Python數據變換...
《實戰Python網路爬蟲》是2019年清華大學出版社出版的一本圖書,作者是黃永祥。內容簡介 本書從原理到實踐,循序漸進地講述了使用Python開發網路爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰篇和爬蟲框架篇三部分。基礎篇主要介紹了編寫網路爬蟲所需的基礎知識,包括網站分析、數據抓取、數據清洗和數據入庫。網站分析...
Spark數據處理引擎是一個驚人的分析工廠:輸入原始數據,輸出洞察。PySpark用基於Python的API封裝了Spark的核心引擎。它有助於簡化Spark陡峭的學習曲線,並使這個強大的工具可供任何在Python數據生態系統中工作的人使用。 《Python和PySpark數據分析》幫助你使用PySpark解決數據科學的日常挑戰。你將學習如何跨多台機器擴展處理...
6.3.3 與Python 整合 81 6.3.4 資料庫技術與最佳實踐 84 6.3.5 MySQL 里的“六度空間遊戲” 86 6.4 Email 88 第二部分 高級網頁抓取 第7 章 讀取文檔 93 7.1 文檔編碼 93 7.2 純文本 94 7.3 CSV 98 7.4 PDF 100 7.5 微軟Word 和.docx 102 第8 章 數據清洗 106 8...