Python數據整理

Python數據整理

《Python數據整理》 是2020年機械工業出版社出版的圖書,作者是[美] 提爾塔吉奧蒂·薩卡。

基本介紹

  • 書名:Python數據整理
  • 作者:[美] 提爾塔吉奧蒂·薩卡
  • 出版社:機械工業出版社
  • ISBN:9787111655787
內容簡介,圖書目錄,作者簡介,

內容簡介

《Python數據整理》是一本實用的Python數據整理入門教程。書中全面、系統地闡釋數據整理和提煉過程背後的所有核心思想,通過大量的練習和實例,幫助你全方位理解並掌握相關概念、工具和技術。
  《Python數據整理》內容共分為9章,第1章詳細介紹數據整理的重要性及工作重點,並介紹Python的基本數據結構及其實現;第2章是《Python數據整理》的基礎,闡述Python中的高級數據結構和作業系統的檔案操作功能;第3章著重描述Python中NumPy、pandas和Matplotlib三個基本庫的基礎知識;第4章深入分析pandasDataFrames的相關知識;第5章介紹套用於現實生活的網頁抓取的數據整理技術;第6章提出現實生活中發生的數據問題,並學習如何解決這些問題;第7章學習如何從網頁、XML檔案和API中收集數據;第8章解釋資料庫的概念,包括戒判籃資料庫的創建、操作和控制,以及如何將表格轉換為pandasDataFrame;第9章將前面所學的知識套用到實際數據集中,並對其不同方面進行研究。
  為了使數據有用且有意義,必須對其進行全催整理和提煉。
  《Python數據整理》將向你揭示這些過程背後的核心思想,並讓你掌握該領域中流行的工具和技術的相關知識。
  《Python數據整理》以Python為基礎,重點關注數據結構,然後深入到數據整理的基本工具,如Numpy和pandas庫。你將深入再檔龍嚷了解為什麼應該遠離基於其他語言實現的傳統數據清理方式,而利用Python中特定的預建例程。
  Python提示和技巧的組合將演示如何使用相同的Python後端從各種數據源(包括網際網路、大型資料庫和Excel財務表)提取和轉換數據。為了幫你應對更具挑戰性的場景,《Python數據整理》將向你介紹如何處理缺失數據或錯誤數據,並根據下游分析工具要求重新格式化數據。《Python數據整理》將通過現實世界的例子和數據集進一步幫助你掌握相關概念。
  通過《Python數據整理》的學習,你將有信心對各種不同的數據源進行高效的提取、清理、轉換並格式化數據。,
  通過閱讀《Python數據整理》,你將學到:
  使用與操作複雜和簡單的數據結構。
  在運行時充分利用DataFrame和Numpy數組。
  使用BeautifuISoup4和htm151ib執行網路抓取。
  使用正則表達式(RegEX)執行高級字元串搜尋和操作。
  通過pandas處理異常值與執行數據填充。
  描述性統計和繪圖技術的使用。
  基於數據生成技術的數據整理和建模。

圖書目錄

譯者序
前言
第1章 Python數據整理入門
1.1 引言
1.2 Python數據整理
1.3 列表、集合、字典、元組和字元串
1.3.1 列表
練習1:訪問列表成員
練習2:生成列表
練習3:遍歷列表並檢查成員
練習4:列表排序
練習5:生成隨機列表
活動1:處理列表
1.3.2 集合
1.3.3 字典
練習6:訪問和設定字典中的值
練習7:遍歷字典
練習8:再次討論唯一值列表問題
練習9:刪除字典中的值
練習10:字典推導式
1.3.4 元組
練習11:處理元組
1.3.5 字元串
練習12:訪問字元串
練習13:字元串切片
練習14:字元串拆分與合併
活動2:分析多行字元串並生成唯一單詞數量
1.4 小結
第2章 高級數據結構和檔案處理
2.1 引言
2.2 高級數據結構
2.2.1 疊代器
練習15:疊代器介紹
2.2.2 棧
練習16:在Python中實現棧
練習17:使用用戶定義的方法實現棧
2.2.3 Lambda表達式
練習18:用Lambda表達式證明三角恆等式
練習19:用於排序的Lambda表達式
練習20:多元素成員檢查
2.2.4 佇列
練習21:在Python中實現佇列
活動3:Permutations、疊代器、Lambda、列表芝歡晚擔
2.3 Python基本檔案操作
練習22:寫入和讀取環境變數
練習23:打開和關閉檔案
練習24:逐行讀取檔案
練習25:寫入檔案
活動局檔市4:設計專屬CSV解析器求櫻汽
2.4 小結
第3章 NumPy、pandas和Matplotlib簡介
3.1 引言
3.2 NumPy數組操作
練習26:從列表中創建NumPy數組
練習27:兩個NumPy數組相加
練習28:NumPy數組的數學運算
練習29:鑽采備NumPy數組的高級數學運算
練習30:使用arange和linspace生成數組
練習31:創建多維數組
練習32:二維數組的維度、形狀、大小和數據類型
練習33:全零、全一、隨機、單位矩陣和向量
……
第4章 深入學習Python數據整理
第5章 適應不同類型的數據源
第6章 學習數據整理的隱藏秘密
第7章 高級網路抓取和數據收集
第8章 關係資料庫管理系統和結構化查詢語言
第9章 數據整理在現實生活中的套用
附錄 活動實施步驟

作者簡介

提爾塔吉奧蒂·薩卡(Tirthajyoti Sarkar),半導體技術領域的高級工程師,他將前沿的數據科學與機器學習技術套用於設計自動化和預測分析,並定期撰寫關於Python編程和數據科學主題的文章。他擁有伊利諾伊大學的博士學位和史丹福大學與麻省理工學院的人工智慧和機器學習的證書。
  舒布哈迪普·羅伊喬杜里(Shubhadeep Roychowdhury),一家總部在巴黎的網路安全初創公司的高級軟體工程師,目前致力於套用先進的計算機視覺、數據工程算法和工具開發尖端產品。他經常撰寫Python算法實現和類似主題的文章。他擁有西孟加拉邦科技大學的計算機科學碩士學位和史丹福大學的機器學習證書。
練習2:生成列表
練習3:遍歷列表並檢查成員
練習4:列表排序
練習5:生成隨機列表
活動1:處理列表
1.3.2 集合
1.3.3 字典
練習6:訪問和設定字典中的值
練習7:遍歷字典
練習8:再次討論唯一值列表問題
練習9:刪除字典中的值
練習10:字典推導式
1.3.4 元組
練習11:處理元組
1.3.5 字元串
練習12:訪問字元串
練習13:字元串切片
練習14:字元串拆分與合併
活動2:分析多行字元串並生成唯一單詞數量
1.4 小結
第2章 高級數據結構和檔案處理
2.1 引言
2.2 高級數據結構
2.2.1 疊代器
練習15:疊代器介紹
2.2.2 棧
練習16:在Python中實現棧
練習17:使用用戶定義的方法實現棧
2.2.3 Lambda表達式
練習18:用Lambda表達式證明三角恆等式
練習19:用於排序的Lambda表達式
練習20:多元素成員檢查
2.2.4 佇列
練習21:在Python中實現佇列
活動3:Permutations、疊代器、Lambda、列表
2.3 Python基本檔案操作
練習22:寫入和讀取環境變數
練習23:打開和關閉檔案
練習24:逐行讀取檔案
練習25:寫入檔案
活動4:設計專屬CSV解析器
2.4 小結
第3章 NumPy、pandas和Matplotlib簡介
3.1 引言
3.2 NumPy數組操作
練習26:從列表中創建NumPy數組
練習27:兩個NumPy數組相加
練習28:NumPy數組的數學運算
練習29:NumPy數組的高級數學運算
練習30:使用arange和linspace生成數組
練習31:創建多維數組
練習32:二維數組的維度、形狀、大小和數據類型
練習33:全零、全一、隨機、單位矩陣和向量
……
第4章 深入學習Python數據整理
第5章 適應不同類型的數據源
第6章 學習數據整理的隱藏秘密
第7章 高級網路抓取和數據收集
第8章 關係資料庫管理系統和結構化查詢語言
第9章 數據整理在現實生活中的套用
附錄 活動實施步驟

作者簡介

提爾塔吉奧蒂·薩卡(Tirthajyoti Sarkar),半導體技術領域的高級工程師,他將前沿的數據科學與機器學習技術套用於設計自動化和預測分析,並定期撰寫關於Python編程和數據科學主題的文章。他擁有伊利諾伊大學的博士學位和史丹福大學與麻省理工學院的人工智慧和機器學習的證書。
  舒布哈迪普·羅伊喬杜里(Shubhadeep Roychowdhury),一家總部在巴黎的網路安全初創公司的高級軟體工程師,目前致力於套用先進的計算機視覺、數據工程算法和工具開發尖端產品。他經常撰寫Python算法實現和類似主題的文章。他擁有西孟加拉邦科技大學的計算機科學碩士學位和史丹福大學的機器學習證書。

相關詞條

熱門詞條

聯絡我們