Python數據分析(清華大學出版社出版的圖書)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《Python數據分析》是2020年清華大學出版社出版的圖書,作者是曹潔 崔霄。

基本信息,內容簡介,目錄,

基本信息

Python數據分析
作者: 曹潔 崔霄 等
定價:99元
印次:1-1
ISBN:9787302542858
出版日期:2020.06.01

內容簡介

Python作為一種程式設計語言,憑藉其簡潔、易讀及可擴展性日漸成為程式設計領域備受推崇的語言。同時,Python語言的數據分析功能也逐漸為大眾認可。本書基於Python 3.6構建Python開發平台,全面涵蓋Python基礎編程知識;詳解數據分析的數據特徵、數據清洗、數據集成、數據規範化、數據歸約、數據降維、數據分析建模、數據可視化和評估等流程,涵蓋了Python常用的數據分析模組和數據分析算法。本書以13章的篇幅介紹Python數據分析,包括Python語言基礎、程式控制結構、函式、正則表達式、檔案與資料夾操作、用matplotlib實現數據可視化、numpy庫、pandas庫、數據質量分析、數據預處理、數據分析方法等內容。

目錄

第1章Python語言基礎1
1.1Python語言的特點1
1.2Python的安裝方法2
1.3編寫Python代碼的方式4
1.3.1用文本編輯器編寫代碼4
1.3.2用命令行格式的Python Shell編寫代碼7
1.3.3用帶圖形界面的Python Shell編寫互動式代碼8
1.3.4用帶圖形界面的Python Shell編寫程式代碼9
1.4Python中的注釋10
1.4.1Python中的單行注釋10
1.4.2Python中的多行注釋10
1.5Python中的對象11
1.5.1對象的身份11
1.5.2對象的類型11
1.5.3對象的值11
1.5.4對象的引用12
1.5.5對象的共享引用12
1.5.6對象是否相等的判斷13
1.6Python中的變數13
1.7Python中的基本數據類型14
1.7.1number(數值)14
1.7.2string(字元串)16
1.7.3list(列表)28
1.7.4tuple(元組)37
1.7.5dictionary(字典)39
1.7.6set(集合)43
1.7.7Python數據類型之間的轉換46〖3〗Python數據分析目錄〖3〗1.8Python中的運算符48
1.9Python中的數據輸入53
1.10Python中的數據輸出55
1.10.1表達式語句輸出55
1.10.2print()函式輸出55
1.10.3字元串對象的format方法的格式化輸出58
1.11Python中檔案的基本操作60
1.12Python庫的導入與擴展庫的安裝61
1.12.1庫的導入61
1.12.2擴展庫的安裝62
第2章程式控制結構64
2.1布爾表達式64
2.2選擇結構65
2.2.1單向if選擇語句65
2.2.2雙向ifelse選擇語句66
2.2.3嵌套if選擇語句和多向ifelifelse選擇語句67
2.3條件表達式69
2.4選擇結構程式舉例70
2.5while循環71
2.6循環控制策略76
2.6.1互動式循環76
2.6.2哨兵式循環77
2.6.3檔案式循環77
2.7for循環79
2.7.1for循環的基本用法79
2.7.2for循環與range()函式的結合使用82
2.8循環中的break、continue和else85
2.8.1用break語句提前終止循環85
2.8.2用continue語句提前結束本次循環86
2.8.3循環語句的else 子句86
2.9循環結構程式舉例89
第3章函式92
3.1為什麼要用函式92
3.2怎樣定義函式93
3.3函式調用95
3.3.1帶返回值的函式調用95
3.3.2不帶返回值的函式調用98
3.4函式參數傳遞98
3.5函式參數的類型99
3.5.1位置參數99
3.5.2關鍵字參數99
3.5.3默認值參數99
3.5.4可變長度參數100
3.5.5序列解包參數101
3.6函式模組化102
3.7lambda表達式104
3.7.1lambda和def的區別104
3.7.2自由變數對lambda表達式的影響107
3.8變數的作用域107
3.8.1變數的局部作用域108
3.8.2變數的全局作用域109
3.8.3變數的嵌套作用域110
3.9函式的遞歸調用111
3.10常用內置函式115
3.10.1map()函式115
3.10.2reduce()函式115
3.10.3filter()函式117
3.11函式舉例118
第4章正則表達式121
4.1什麼是正則表達式121
4.2正則表達式的構成121
4.3正則表達式的模式匹配124
4.3.1正則表達式的邊界匹配124
4.3.2正則表達式的分組、選擇和引用匹配125
4.3.3正則表達式的貪婪匹配與懶惰匹配128
4.4正則表達式模組re129
4.5正則表達式對象133
4.6Match對象135
4.7正則表達式舉例138
第5章檔案與資料夾操作140
5.1文本檔案140
5.1.1文本檔案的字元編碼140
5.1.2文本檔案的打開142
5.1.3文本檔案的寫入145
5.1.4文本檔案的讀取146
5.1.5文本檔案指針的定位148
5.2二進制檔案149
5.2.1二進制檔案的寫入149
5.2.2二進制檔案的讀取150
5.2.3位元組數據類型的轉換150
5.3檔案與資料夾操作152
5.3.1使用os操作檔案與資料夾152
5.3.2使用os.path操作檔案與資料夾154
5.3.3使用shutil操作檔案與資料夾156
5.4csv檔案的讀取和寫入158
5.4.1使用csv.reader()讀取csv檔案158
5.4.2使用csv.writer()寫入csv檔案159
5.4.3使用csv.DictReader()讀取csv檔案161
5.4.4使用csv.DictWriter()寫入csv檔案162
5.4.5csv檔案的格式化參數163
5.4.6自定義dialect165
5.5檔案與檔案操作舉例166
第6章用matplotlib實現數據可視化168
6.1matplotlib架構168
6.1.1後端層168
6.1.2表現層169
6.1.3腳本層171
6.2matplotlib的pyplot子庫172
6.2.1繪製線形圖174
6.2.2繪製直方圖181
6.2.3繪製條形圖183
6.2.4繪製餅圖187
6.2.5繪製散點圖189
第7章numpy庫192
7.1ndarray多維數組192
7.1.1創建ndarray數組192
7.1.2創建特殊的ndarray數組194
7.1.3ndarray對象的數據類型200
7.1.4ndarray對象的屬性201
7.2數組元素的索引、切片和選擇202
7.2.1索引和切片202
7.2.2選擇數組元素的方法203
7.2.3ndarray數組的形狀變換207
7.3隨機數數組209
7.3.1簡單隨機數209
7.3.2隨機分布211
7.3.3隨機排列213
7.4數組的運算215
7.4.1算術運算與函式運算215
7.4.2統計計算218
7.4.3線性代數運算221
7.4.4排序224
7.4.5數組拼接與切分225
7.5讀寫數據檔案228
7.5.1讀寫二進制檔案228
7.5.2讀寫文本檔案229
第8章pandas庫231
8.1Series對象231
8.1.1Series對象創建231
8.1.2Series對象的屬性233
8.1.3Series對象的數據查看和修改234
8.2Series對象的基本運算235
8.2.1算術運算與函式運算235
8.2.2Series對象之間的運算237
8.3DataFrame對象237
8.3.1DataFrame對象創建237
8.3.2DataFrame對象的屬性240
8.3.3查看和修改DataFrame對象的元素242
8.3.4判斷元素是否屬於DataFrame對象244
8.4DataFrame對象的基本運算245
8.4.1數據篩選245
8.4.2數據預處理247
8.4.3數據運算與排序264
8.4.4數學統計270
8.4.5數據分組與聚合277
8.5pandas數據可視化284
8.5.1繪製折線圖286
8.5.2繪製條形圖287
8.5.3繪製直方圖288
8.5.4繪製箱線圖290
8.5.5繪製區域圖290
8.5.6繪製散點圖291
8.5.7繪製餅狀圖292
8.6pandas讀寫數據293
8.6.1讀寫csv檔案293
8.6.2讀取txt檔案296
8.6.3讀寫Excel檔案298
8.7篩選和排序數據實例302
第9章數據質量分析304
9.1缺失值分析304
9.2異常值分析305
9.3一致性分析308
9.4數據特徵分析309
9.4.1分布分析309
9.4.2統計量分析309
9.4.3周期性分析313
9.4.4相關性分析314
9.4.5貢獻度分析316
第10章數據預處理319
10.1數據清洗319
10.1.1處理缺失值319
10.1.2噪聲數據處理329
10.2數據集成331
10.2.1實體識別問題331
10.2.2屬性冗餘問題332
10.2.3元組重複問題332
10.2.4屬性值衝突問題333
10.3數據規範化333
10.3.1最小最大規範化333
10.3.2z分數規範化335
10.3.3小數定標規範化335
10.4數據離散化335
10.4.1無監督離散化336
10.4.2監督離散化337
10.5數據歸約338
10.5.1過濾法338
10.5.2包裝法340
10.5.3嵌入法341
10.6數據降維342
10.6.1主成分分析342
10.6.2線性判別分析法343
10.7數據預處理舉例344
第11章數據分析方法350
11.1相似度和相異度的度量350
11.1.1數據對象之間的相異度350
11.1.2數據對象之間的相似度352
11.2分類分析方法354
11.2.1決策樹分類方法355
11.2.2樸素貝葉斯分類方法362
11.2.3支持向量機方法369
11.3回歸分析方法374
11.3.1一元線性回歸375
11.3.2多元線性回歸380
11.3.3邏輯回歸分析386
11.4聚類分析方法391
11.4.1聚類分析的概念391
11.4.2劃分聚類方法392
11.4.3層次聚類方法397
11.4.4基於密度的聚類方法406
第12章基於信用卡消費行為的銀行信用風險分析410
12.1背景介紹410
12.2數據獲取與數據探索分析411
12.2.1數據獲取411
12.2.2數據探索分析411
12.3數據預處理413
12.3.1缺失值處理413
12.3.2異常值處理415
12.4數據特徵分析417
12.4.1單變數分析417
12.4.2多變數分析419
12.5客戶信用分析419
12.5.1特徵選擇419
12.5.2邏輯回歸分析420
第13章文本情感分析421
13.1中文分詞方法421
13.1.1基於字元串匹配的分詞方法422
13.1.2基於統計的分詞方法425
13.1.3基於理解的分詞方法429
13.2文本的關鍵字提取429
13.2.1基於文檔頻率的關鍵字提取429
13.2.2基於互信息的關鍵字提取429
13.2.3基於詞頻逆檔案頻率的關鍵字提取430
13.3文本情感分析簡介435
13.3.1文本情感分析的層次435
13.3.2中文文本情感傾向分析436
13.4LDA主題模型438
13.4.1LDA主題模型介紹438
13.4.2LDA主題模型的最大似然參數估計440
13.5運用LDA模型對電商手機評論進行主題分析443
13.5.1電商手機評論數據的採集443
13.5.2評論預處理450
13.5.3評論文本分詞457
13.5.4去除停用詞458
13.5.5繪製評論文本的詞雲圖459
13.5.6評論文本情感傾向分析461
13.5.7評論文本的LDA主題分析466
參考文獻469

相關詞條

熱門詞條

聯絡我們