《SAS技術內幕:從程式設計師到數據科學家》是2018年12月清華大學出版社出版的圖書,作者是巫銀良。
基本介紹
- 中文名:SAS技術內幕:從程式設計師到數據科學家
- 作者:巫銀良
- 出版社:清華大學出版社
- 出版時間:2018年12月1日
- 定價:168 元
- ISBN:9787302502784
內容簡介,圖書目錄,
內容簡介
本書共27章,分為上下兩卷:上卷介紹SAS編程基礎與使用方法,是廣大程式設計師快速掌握SAS編程技術的簡明開發教程;下卷闡述數據分析的關鍵基礎知識並提供相應SAS代碼實現,目的是激發讀者興趣,跨越傳統編程與數據分析的鴻溝,從程式設計師華麗轉身為數據科學家。書中演示代碼力圖簡潔清晰地解釋相關概念,追求大道至簡。本書兼顧編程技術與數據分析,期許程式設計師、信息處理與統計分析人員以及對數據分析科學感興趣的讀者都能從本書中獲益良多,循序漸進地掌握數據分析的要義和精髓,從數據中獲取洞見與智慧。
圖書目錄
上 卷
第1章 SAS語言入門 002
1.1 語言概述 005
1.2 編程環境 010
1.3 SAS Studio編程 016
第2章 數據集與DATA步 032
2.1 SAS 邏輯庫 032
2.2 SAS 數據集 036
2.3 DATA 步 041
2.3.1 內嵌數據行或外部數據檔案 043
2.3.2 通過已有 SAS 數據集生成 048
2.3.3 通過 PROC IMPORT 或 PROC SQL 生成 051
2.4 DATA 步的運行機制 054
2.4.1 編譯階段 055
2.4.2 運行階段 056
2.5 DATA 步語句快速索引 057
第3章 變數與表達式 062
3.1 常量與變數 062
3.1.1 變數長度與缺失值 063
3.1.2 數值常量 065
3.1.3 日期/時間/日期時間常量 067
3.1.4 字元常量 067
3.2 表達式 068
3.2.1 運算符 068
3.2.2 運算符優先順序 072
3.2.3 WHERE 語句特定運算符 072
3.2.4 賦值語句 073
3.2.5 累加賦值語句 074
3.2.6 RETAIN 語句 075
SAS技術內幕:從程式設計師到數據科學家
3.3 SAS數組 077
3.3.1 數組名稱 079
3.3.2 數組元素變數列表 079
3.3.3 數組長度 080
3.3.4 隱式下標變數080
3.3.5 多維數組081
3.3.6 臨時數組082
3.3.7 數組排序083
3.3.8 注意事項084
第4章流程控制087
4.1 DO-END語句塊087
4.2 分支控制088
4.2.1 IF-THEN分支控制088
4.2.2 ELSE-IF多分支控制090
4.2.3 SELECT-WHEN多分支控制090
4.3 循環控制091
4.3.1 指定次數的循環:DO-TO-BY091
4.3.2 指定條件的循環:DO-WHILE與DO-UNTIL092
4.3.3 指定集合的循環:DO-OVER093
4.4 特殊的流程控制語句094
4.4.1 跳出循環語句:LEAVE094
4.4.2繼續循環語句:CONTINUE094
4.4.3 返回語句:RETURN095
4.4.4 中止執行語句:STOP與ABORT095
4.4.5 跳轉語句:GOTO與LINK096
第5章函式封裝099
5.1 LINK-RETURN技術101
5.2 SAS宏函式封裝103
5.3 FCMP函式105
5.4 系統函式速查110
第6章SAS宏113
6.1 宏變數114
6.1.1 命名114
6.1.2 作用域114
6.1.3 系統宏115
6.1.4 宏代碼調試117
目錄
XIII
6.1.5 宏表達式117
6.2 宏函式119
參數定義120
6.3 邏輯控制121
6.3.1 宏語句塊121
6.3.2 條件分支121
6.3.3 循環控制121
6.4 系統宏函式122
第7章DS2124
7.1 程式結構126
7.1.1 變數聲明與類型126
7.1.2 程式實體作用域129
7.1.3 變數數組與標準數組130
7.1.4 系統方法與用戶自定義方法131
7.2 數據程式136
7.3 包程式137
7.4 執行緒程式143
第8章代碼組織149
8.1 靜態檔案包含149
8.2 程式中動態擴展代碼151
8.3 動態執行外部命令153
第9章檔案讀寫157
9.1 二進制檔案讀寫157
9.2 文本檔案讀寫159
9.3 順序讀取多個檔案162
9.4 並行讀取多個檔案165
9.5 共享緩衝區讀寫166
第10章按位運算168
10.1 按位運算168
10.2 實現方法169
10.3 按位運算套用173
第11章擴展SAS功能177
11.1 通過Module調用外部DLL函式177
11.2 用C語言開發用戶函式館182
11.2.1 準備64位C編譯環境182
SAS技術內幕:從程式設計師到數據科學家
11.2.2 開發用戶自定義動態庫183
11.3 PROTO編寫C代碼或註冊外部DLL184
第12章數據結構——數組187
12.1 數組187
12.1.1 DATA步數組187
12.1.2 FCMP數組189
12.1.3 DS2數組192
12.1.4 SAS宏數組193
12.2數組套用:高精度數值計算194
第13章數據結構——佇列與堆疊196
13.1 佇列196
13.1.1 函式版實現與示例196
13.1.2 宏版實現與示例199
13.2 堆疊202
函式版實現與示例202
第14章數據結構——鍊表206
14.1 基礎知識206
14.2 如何在SAS代碼中內嵌C語言代碼207
14.3 單向鍊表和雙向鍊表209
14.4 鍊表套用:約瑟夫斯問題216
第15章數據結構——二叉樹221
15.1 PROTO實現與封裝221
15.2 FCMP二叉樹實現227
15.3 二叉樹套用:算術表達式求值231
第16章數據結構——矩陣運算235
16.1 FCMP矩陣運算236
16.2 DS2矩陣運算243
16.3 矩陣套用:線性方程組求解246
16.4 矩陣套用:非線性方程組求解248
第17章數據結構——圖255
17.1 深度優先和廣度優先遍歷256
17.2 最短路徑問題260
17.2.1 Dijkstra算法261
17.2.2 Bellman-Ford算法263
17.2.3 Floyd-Warshall算法265
目錄
下卷
第18章統計學基礎270
18.1 數據特徵度量270
18.1.1 集中趨勢度量272
18.1.2 離散趨勢度量274
18.1.3 分布特徵度量277
18.1.4 置信區間、置信水平與p-值279
18.2 統計學上的變數類型280
18.3 基本數據處理283
18.3.1 排序與排名284
18.3.2 數據轉置285
18.3.3 堆疊與拆分286
18.3.4 過濾數據287
18.3.5 隨機抽樣289
18.3.6基本統計量290
18.4 基本圖形圖表292
18.5 SAS產品與過程步概覽303
18.5.1 SAS核心產品功能簡介305
18.5.2 BaseSAS過程步速查309
18.5.3SAS/STAT過程步速查318
第19章大數定律與中心極限定理327
19.1 大數定律327
19.1.1 弱大數定律327
19.1.2 三種大數定律329
19.1.3 圖形化證明330
19.1.4 強大數定律333
19.2 中心極限定理334
19.2.1 大數定律與中心極限定理關係335
19.2.2 圖形化證明336
19.2.3 實際用途340
第20章統計分布342
20.1 均勻分布342
20.2 離散型統計分布345
20.2.1 伯努利分布345
SAS技術內幕:從程式設計師到數據科學家
20.2.2 二項分布347
20.2.3 幾何分布353
20.2.4 負二項分布357
20.2.5 超幾何分布360
20.2.6 泊松分布362
20.3 連續型統計分布365
20.3.1 常態分配365
20.3.2 對數常態分配373
20.3.3 指數分布376
20.3.4 卡方分布379
20.3.5 學生t-分布381
20.3.6 F分布387
20.3.7 柯西分布390
20.3.8 貝塔分布392
20.3.9 伽馬分布395
20.3.10 愛爾朗分布397
20.3.11 韋布爾分布399
20.3.12 三角分布400
20.3.13 Table分布401
附錄:各統計分布之間的關係403
第21章方差分析404
21.1 假設檢驗404
21.2 方差分析406
21.2.1 學生t-檢驗406
21.2.2 單因子方差分析408
21.2.3 雙因子方差分析418
第22章數據標準化421
22.1 常用標準化方法421
22.2 SAS數據標準化424
22.3 自定義數據標準化429
第23章主成分分析與因子分析433
23.1 主成分分析434
23.1.1 主成分分析原理435
23.1.2 主成分分析的具體步驟436
23.2 因子分析443
目錄
23.2.1 因子分析原理443
23.2.2 巴特利球度檢驗和KMO檢驗443
23.2.3 因子分析的具體步驟445
第24章相關分析與回歸分析450
24.1 變數關係450
24.2 相關分析451
24.2.1 線性相關性度量451
24.2.2 非參數關聯度量452
24.2.3 定量數據的相關分析455
24.2.4 類別數據的相關分析457
24.3 回歸分析460
第25章聚類分析467
25.1 聚類度量469
25.1.1 距離係數469
25.1.2 相似性/相關係數471
25.1.3 SAS實踐473
25.2 聚類形成方法475
25.2.1 一次形成分類系統475
25.2.2 K-均值聚類477
25.2.3 逐步形成分類系統485
25.2.4 R型聚類分析491
25.3 自己實現聚類算法494
25.3.1 K-均值方法494
25.3.2 逐步形成分類系統501
附錄:聚類度量的自定義實現509
第26章神經網路512
26.1 神經元模型513
26.2 神經網路517
26.2.1 訓練神經網路519
26.2.2 反向傳播算法519
26.3 SAS代碼實現與範例524
第27章π高精度求解與探索分析536
27.1 π值計算537
27.1.1 蒙特卡羅方法543
27.1.2 蒲豐投針方法544
SAS技術內幕:從程式設計師到數據科學家
27.1.3 微積分方法545
27.1.4 冪級數方法546
27.1.5 冪級數高精度方法548
27.1.6 梅欽類公式高精度方法550
27.1.7 疊代方法——貝拉公式554
27.2 π值分析557
27.2.1 數字分布規律558
27.2.2 可視化探索561
附錄564
參考文獻598