Python數據分析與機器學習(微課視頻版)

Python數據分析與機器學習(微課視頻版)

《Python數據分析與機器學習(微課視頻版)》是清華大學出版社出版的圖書。

基本介紹

  • 中文名:Python數據分析與機器學習(微課視頻版)
  • 作者:楊年華
  • 出版時間:2023年1月1日
  • 出版社清華大學出版社
  • ISBN:9787302611516
  • 定價:110 元
內容簡介,圖書目錄,

內容簡介

本書首先簡要介紹Python語言的基礎知識,為後續內容的學習提供基礎,接著介紹NumPy、Matplotlib和Pandas三個數據分析基礎模組的用法,同時也為後面基於scikitlearn的機器學習提供基礎,最後介紹基於scikitlearn機器學習及其模型的評價方法、超參數調優方法。全書通過大量案例,希望能讓讀者快速提高實踐能力。 本書適合作為高校本科生或研究生數據分析、機器學習等相關課程的教材或參考書,也可作為數據分析和機器學習愛好者的自學教程,還可以作為相關科研工作者與工程實踐者的參考書。

圖書目錄

第1章Python語言與開發環境概述
1.1Python語言的特點
1.2Python的下載與安裝
1.3開始使用Python
1.3.1互動方式
1.3.2代碼檔案方式
1.3.3代碼檔案的打開
1.3.4代碼風格
1.4模組與庫
1.4.1模組及其導入方式
1.4.2標準模組與第三方模組
1.5使用幫助
1.6Anaconda簡介
1.6.1Anaconda模組的安裝
1.6.2Spyder的使用
1.6.3Jupyter Notebook的使用
1.6.4Jupyter Notebook默認路徑的設定
1.6.5任意路徑下創建Jupyter Notebook檔案
習題1
第2章Python語言基礎
2.1控制台的輸入與輸出
2.1.1數據的輸入
2.1.2數據的輸出
2.2標識符、變數與賦值語句
2.2.1標識符
2.2.2變數
2.2.3賦值語句
2.3常用數據類型
2.3.1數值類型
2.3.2布爾類型
2.3.3常用序列類型
2.3.4映射類型
2.3.5集合類型
2.4運算符與表達式
2.4.1運算符分類
2.4.2運算規則與表達式
2.4.3條件表達式
2.4.4複合賦值運算符
2.5分支結構
2.5.1單分支if語句
2.5.2雙分支if/else語句
2.5.3多分支if/elif/else語句
2.5.4分支結構的嵌套
2.5.5分支結構的三元運算
2.5.6match/case分支結構
2.6循環結構
2.6.1簡單的while循環結構
2.6.2簡單的for循環結構
2.6.3break語句和continue語句
2.6.4循環的嵌套
2.7常用組合類型
2.7.1列表
2.7.2元組
2.7.3列表與元組之間的相互生成
2.7.4字元串
2.7.5字典
2.7.6集合
2.7.7推導式
2.7.8常用的內置函式
2.8正則表達式
習題2
第3章函式
3.1函式的定義
3.2函式的調用
3.3形參與實參
3.4函式的返回
3.5位置參數與關鍵參數
3.6默認參數
3.7個數可變的參數
3.7.1以組合對象為形參接收多個實參
3.7.2以組合對象為實參給多個形參分配參數
3.7.3形參和實參均為組合類型
3.8參數與返回值類型註解
3.9lambda表達式
3.10函式式編程的常用類與函式
習題3
第4章自定義類與對象
4.1Python中的對象與方法
4.2類的定義與對象的創建
4.3類的繼承
4.3.1父類與子類
4.3.2繼承的語法
4.3.3子類繼承父類的屬性
4.3.4子類繼承父類的方法
習題4
第5章NumPy數據處理基礎
5.1數據結構
5.1.1利用numpy.array()函式創建數組
5.1.2訪問數組對象屬性
5.1.3數組對象的類型
5.1.4創建常用數組
5.2數據準備
5.2.1隨機數的生成
5.2.2NumPy數組在文本檔案中的存取
5.3常用數組運算與函式
5.3.1數組的索引
5.3.2數組的切片
5.3.3改變數組的形狀
5.3.4數組對角線上替換新元素值
5.3.5用np.newaxis或None插入一個維度
5.3.6數組的基本運算
5.3.7數組的排序
5.3.8數組的組合
5.3.9數組的分割
5.3.10隨機打亂數組中的元素順序
5.3.11多維數組的展開
5.3.12其他常用函式與對象
5.4使用NumPy進行簡單統計分析
5.5數組在其他檔案中的存取
5.5.1數組在無格式二進制檔案中的存取
5.5.2數組在npy檔案中的存取
5.5.3數組在npz檔案中的存取
5.5.4數組在hdf5檔案中的存取
習題5
第6章Matplotlib數據可視化基礎
6.1繪製基本圖形
6.1.1折線圖
6.1.2線條屬性的設定
6.1.3圖示題、坐標軸標題和坐標軸範圍的設定
6.1.4繪製多圖與圖例的設定
6.1.5散點圖
6.1.6直方圖
6.1.7餅圖
6.2繪製多軸圖
6.2.1用subplot()函式繪製多軸圖
6.2.2用subplot2grid()函式繪製多軸圖
6.2.3多軸圖的軸展開與遍歷
6.3坐標軸的刻度標籤
6.4坐標軸的主次刻度、格線設定
6.5移動坐標軸
6.6文字說明和注釋
6.7顯示圖片
6.8日期作為橫坐標
6.9繪製橫線與豎線作為輔助線
6.9.1使用hlines()和vlines()函式繪製輔助線
6.9.2使用axhline()和axvline()函式繪製輔助線
6.10繪製其他二維圖表
6.10.1箱線圖
6.10.2小提琴圖
6.10.3熱力圖
6.10.4填充圖
6.10.5等高線圖
6.11繪製三維圖表
6.11.1三維折線圖
6.11.2三維散點圖
6.11.3三維曲面圖
習題6
第7章Pandas數據處理與分析
7.1數據結構與基本操作
7.1.1Series基礎
7.1.2DataFrame基礎
7.2檔案與資料庫中存取DataFrame對象
7.2.1csv檔案中存取DataFrame對象
7.2.2Excel檔案中存取DataFrame對象
7.2.3資料庫中存取DataFrame對象
7.3常用函式與方法
7.3.1用drop()刪除指定的行或列
7.3.2用append()添加元素
7.3.3用unique()去除重複元素
7.3.4用Series.map()實現數據替換
7.3.5用apply()將指定函式套用於數據
7.3.6用applymap()將指定函式套用於元素
7.3.7用replace()替換指定元素
7.3.8用align()對齊兩個對象的行列
7.3.9用groupby()實現分組
7.3.10用assign()添加新列
7.3.11用where()篩選與替換數據
7.3.12用value_counts()統計元素出現的次數或頻率
7.3.13用pivot()按指定列值重新組織數據
7.3.14用pivot_table()創建數據透視圖
7.3.15用idxmax()/idxmin()獲取最大值/最小值所在的行或列
標籤
7.4DataFrame對象的數據清洗與處理
7.4.1用concat()根據行列標籤合併數據
7.4.2數據排序
7.4.3記錄排名
7.4.4記錄抽取
7.4.5重建索引
7.4.6根據新索引填充新位置的值
7.4.7缺失值處理
7.4.8重複值處理
7.4.9數據轉換與替代
7.4.10數據計算
7.4.11用merge()根據列內容或行標籤合併數據對象
7.4.12combine()基於指定函式合併數據
7.4.13combine_first()用一個對象更新另一個對象中的空值
7.5時間處理
7.5.1Python標準庫中的時間處理
7.5.2用dateutil解析字元串格式的日期
7.5.3Pandas中的時間數據處理
7.5.4時間作為行或列的標籤
7.5.5根據時間頻率重新採樣
7.6移動數據與時間索引
7.7統計分析
7.7.1基本統計分析
7.7.2相關分析
7.8Pandas中的繪圖方法
7.8.1繪圖基本接口plot()
7.8.2其他繪圖函式
習題7
第8章機器學習方法概述與數據載入
8.1機器學習概述
8.1.1用有監督學習做預測
8.1.2用無監督學習發現數據之間的關係
8.2scikitlearn的簡介與安裝
8.2.1scikitlearn的安裝
8.2.2scikitlearn中的數據表示
8.2.3scikitlearn中的機器學習基本步驟
8.3載入數據
8.3.1載入scikitlearn中的小數據集
8.3.2下載並載入scikitlearn中的大數據集
8.3.3用scikitlearn構造仿真數據集
8.3.4載入scikitlearn中的其他數據集
8.3.5通過pandasdatareader導入金融數據
8.3.6通過第三方平台API載入數據
8.4劃分數據分別用於訓練和測試
8.5scikitlearn中機器學習的基本步驟示例
8.5.1有監督分類學習步驟示例
8.5.2有監督回歸學習步驟示例
8.5.3無監督聚類學習步驟示例
8.6scikitlearn編程接口的風格
習題8
第9章數據預處理
9.1特徵的離散化
9.1.1使用NumPy中的digitize()函式離散化
9.1.2使用Pandas中的cut()函式離散化
9.2識別與處理異常值
9.3特徵值的MinMax縮放
9.4特徵值的標準化
9.5特徵值的穩健縮放
9.6無序分類數據的熱編碼
9.7有序分類數據編碼
9.8每個樣本特徵值的正則化
習題9
第10章模型評估與軌道
10.1模型評估的基本方法
10.1.1監督學習下的泛化、過擬合與欠擬合
10.1.2模型評估指標
10.1.3交叉驗證
10.2軌道的創建與使用
10.2.1創建和使用軌道
10.2.2交叉驗證中使用軌道
習題10
第11章有監督學習之分類與回歸
11.1分類與回歸概述
11.2線性回歸
11.2.1普通線性回歸
11.2.2嶺回歸使用l2正則化減小方差
11.2.3Lasso回歸使用l1正則化減小特徵個數
11.2.4同時使用l1和l2正則化的彈性網路
11.2.5多項式回歸
11.3邏輯回歸與嶺回歸實現線性分類
11.3.1單標籤二分類
11.3.2單標籤多分類
11.3.3通過正則化降低過擬合
11.4支持向量機用於分類和回歸
11.4.1支持向量機線性分類
11.4.2支持向量機非線性分類
11.4.3支持向量機回歸模型
11.5樸素貝葉斯分類
11.6決策樹用於分類和回歸
11.6.1決策樹用於分類
11.6.2決策樹用於回歸
習題11
第12章集成學習
12.1投票法集成
12.1.1投票分類器
12.1.2投票回歸器
12.2bagging/pasting法集成
12.2.1bagging/pasting分類器
12.2.2bagging/pasting回歸器
12.2.3隨機森林
12.2.4極端隨機樹集成
12.3提升法集成
12.3.1AdaBoost
12.3.2梯度提升
12.3.3XGBoost
12.3.4基於直方圖的梯度提升
12.4堆疊法集成
12.4.1StackingClassifer集成分類
12.4.2StackingRegressor集成回歸
習題12
第13章無監督學習之聚類與降維
13.1用k均值算法基於相似性聚類
13.2層次聚類
13.3基於密度的聚類
13.4聚類性能的評估
13.4.1數據帶真實標籤的聚類評估
13.4.2數據不帶真實標籤的聚類評估
13.5無監督的降維
13.5.1主成分分析
13.5.2核主成分分析
習題13
第14章超參數調優與模型選擇
14.1搜尋超參數來選擇模型
14.1.1基於循環語句的格線搜尋
14.1.2劃分驗證集避免過擬合
14.1.3帶交叉驗證的格線搜尋
14.1.4帶交叉驗證的隨機搜尋
14.1.5搜尋多個不同特徵的空間
14.2對軌道中的超參數進行搜尋
14.3搜尋算法和超參數
習題14
參考文獻

相關詞條

熱門詞條

聯絡我們