Python數據分析與實踐

Python數據分析與實踐

《Python數據分析與實踐》是2019年6月清華大學出版社出版的圖書,作者是柳毅、毛峰、李藝。

基本介紹

  • 中文名:Python數據分析與實踐
  • 作者:柳毅、毛峰、李藝
  • 出版時間:2019年6月
  • 出版社清華大學出版社
  • ISBN:9787302515791
  • 定價:59 元
內容簡介,圖書目錄,

內容簡介

Python是信息管理與信息系統、電子商務等信息管理類本科學生進行數據分析所需要掌握的基礎性語言和分析工具,是未來學生掌握大數據分析技術的學習基礎。本書共分12章,著重講述Python語言和數據分析工具包的套用。
第1章主要介紹Python的發展歷史、特點、集成開發環境、內置模組、幫助的使用等內容; 第2章主要介紹Python語言的基礎知識; 第3章主要介紹Python中的常用數據結構,包括序列、字典、集合等,以及函式的定義和調用等; 第4章主要介紹Python中類、對象和方法的相關內容; 第5章主要介紹Python進行數據分析常用的NumPy、Pandas、Matplotlib、SciPy和Scikitlearn等基礎庫內容; 第6章主要介紹網路數據獲取的HTML和XML兩種網頁組織形式,以及urllib和BeautifulSoup4兩個模組內容; 第7章主要介紹檔案的操作; 第8章主要介紹數據可視化,以及使用Python繪製圖表的知識; 第9章主要介紹利用Python進行資料庫套用開發; 第10、11章主要介紹Python機器學習的基本概念以及有監督、無監督學習算法的原理; 第12章主要介紹Python在地理空間分析上的套用。本書中的代碼均在Python 3.5中測試通過。
本書一方面側重對Python數據分析基礎知識的講解,另一方面注重Python數據處理方法的套用。本書適合作為計算機科學與技術專業學生學習數據分析的入門教材,也適合作為Python愛好者的參考書。

圖書目錄

第1章Python簡介
1.1Python語言的發展史
1.1.1Python語言的特點
1.1.2Python 2與Python 3的區別
1.2Python的環境搭建
1.3開始使用Python IDLE
1.3.1互動方式
1.3.2Python的集成開發環境
1.4Eclipse+PyDev的安裝
1.5代碼風格
1.6使用幫助
本章小結
習題
第2章Python語言基礎知識
2.1標識符與變數
2.1.1標識符
2.1.2變數
2.2數據類型及運算
2.2.1數據類型
2.2.2運算符和表達式
2.3分支結構控制語句
2.3.1if語句
2.3.2ifelse語句
2.3.3ifelifelse語句
2.4循環語句
2.4.1循環結構控制語句
2.4.2循環嵌套控制語句
2.4.3break語句和continue語句
2.4.4range函式
2.5常見的Python函式
本章小結
習題
第3章數據結構與函式設計
3.1序列
3.1.1列表
3.1.2元組
3.1.3字元串
3.1.4列表與元組之間的轉換
3.2字典
3.2.1創建字典
3.2.2字典的方法
3.2.3列表、元組與字典之間的轉換
3.3集合
3.3.1集合的創建
3.3.2集合的運算
3.3.3集合的方法
3.4函式的定義
3.4.1函式的調用
3.4.2形參與實參
3.4.3函式的返回
3.4.4位置參數
3.4.5默認參數與關鍵字參數
3.4.6可變長度參數
本章小結
習題
第4章類與對象
4.1面向對象
4.1.1面向對象編程
4.1.2類的抽象與封裝
4.2認識Python中的類、對象和方法
4.2.1類的定義與創建
4.2.2構造函式
4.3類的屬性
4.3.1類屬性和實例屬性
4.3.2公有屬性和私有屬性
4.4類的方法
4.4.1類方法的調用
4.4.2類方法的分類
4.4.3析構函式
4.5類的繼承
4.5.1父類與子類
4.5.2繼承的語法
4.5.3多重繼承
4.5.4運算符的重載
4.6類的組合
4.7類的異常處理
4.7.1異常
4.7.2Python中的異常類
4.7.3捕獲與處理異常
4.7.4自定義異常類
4.7.5with語句
4.7.6斷言
本章小結
習題
案例
第5章Python數據分析基礎庫
5.1NumPy
5.1.1ndarray的數據類型
5.1.2數組和標量之間的運算
5.1.3索引和切片
5.1.4數組轉置和軸對換
5.1.5利用數組進行數據處理
5.1.6數學和統計方法
5.2Pandas
5.2.1Pandas數據結構
5.2.2Pandas檔案操作
5.2.3數據處理
5.2.4層次化索引
5.2.5分級順序
5.2.6使用DataFrame的列
5.3Matplotlib
5.3.1figure和subplot
5.3.2調整subplot周圍的間距
5.3.3顏色、標記和線型
5.3.4刻度標籤和圖例
5.3.5添加圖例
5.3.6將圖表保存到檔案
5.4SciPy
5.5Scikitlearn
本章小結
習題
第6章網路數據的獲取
6.1網頁數據的組織形式
6.1.1HTML
6.1.3HTML屬性
6.2XML
6.2.1XML的結構和語法
6.2.2XML元素和屬性
6.3利用urllib處理HTTP
6.4利用BeautifulSoup4解析HTML文檔
6.4.1BeautifulSoup4中的對象
6.4.2遍歷文檔樹
6.4.3搜尋文檔樹
本章小結
習題
第7章檔案操作
7.1檔案的打開和關閉
7.1.1打開檔案
7.1.2關閉檔案
7.2讀寫檔案
7.2.1從檔案讀取數據
7.2.2向檔案寫入數據
7.3檔案對話框
7.3.1基於win32ui構建檔案對話框
7.3.2基於tkFileDialog構建檔案對話框
7.4套用實例: 文本檔案的操作
本章小結
習題
第8章Python數據可視化
8.1數據可視化概念框架
8.1.1數據可視化簡介
8.1.2數據可視化常用圖表
8.1.3Python數據可視化環境準備
8.2繪製圖表
8.2.1Matplotlib API入門
8.2.2創建圖表
8.2.3圖表定製
8.2.4保存圖表
8.3更多高級圖表及定製
8.3.1樣式
8.3.2subplot子區
8.3.3圖表顏色和填充
8.3.4動畫
本章小結
習題
第9章資料庫套用開發
9.1Python與資料庫
9.1.1資料庫簡介
9.1.2Python資料庫工作環境
9.2本地資料庫SQLite
9.2.1SQLite簡介
9.2.2Python內置的sqlite3模組
9.3.1關係型資料庫基本操作與SQL
9.3.2操作MySQL
9.4.1NoSQL介紹
9.4.2MongoDB
9.4.3PyMongo: MongoDB和Python
習題
第10章機器學習——有監督學習
10.1機器學習簡介
10.2Python機器學習庫Scikitlearn
10.3有監督學習
10.3.1線性回歸
10.3.2Logistic回歸分類器
10.3.5KNN算法
10.3.6決策樹
本章小結
習題
第11章機器學習——無監督學習
11.1無監督學習
11.2聚類
11.2.1相異度
11.2.2KMeans算法
11.2.3DBSCAN算法
11.3關聯規則
11.3.1關聯分析
11.3.2Apriori算法
11.3.3FPgrowth算法
本章小結
習題
第12章Python地理空間分析
12.1地理空間分析簡介
12.1.1地理空間分析的基本概念
12.1.2地理空間分析與Python
12.2地理空間數據
12.2.1數據格式概覽
12.2.2數據特徵
12.2.3矢量數據
12.2.4柵格數據
12.3Python地理空間分析工具
12.3.1GeoJSON
12.3.2GDAL和OGR
12.3.3PyShp
12.3.4PIL
12.3.5GeoPandas
12.4Python分析矢量數據
12.4.1訪問矢量數據
12.4.2Shapefile檔案操作
12.4.3空間查詢
12.4.4疊加分析
12.5Python與遙感
12.5.1訪問影像檔案
12.5.2影像裁剪
12.5.3重採樣
12.5.4影像分類
12.6“五水共治”資源地理空間分析綜合套用
本章小結
習題

相關詞條

熱門詞條

聯絡我們