量化投資――MATLAB數據挖掘技術與實踐(第2版)

量化投資――MATLAB數據挖掘技術與實踐(第2版)

《量化投資――MATLAB數據挖掘技術與實踐(第2版)》是2020年電子工業出版社出版的圖書,作者是卓金武。

基本介紹

  • 書名:量化投資――MATLAB數據挖掘技術與實踐(第2版)
  • 作者:卓金武
  • 出版社: 電子工業出版社
  • 裝幀:平裝
  • ISBN:9787121398476
內容簡介,圖書目錄,

內容簡介

全書內容分為三篇。第1篇為基礎篇,主要介紹量化投資與數據挖掘的關係,以及數酷匙據挖掘的概念、實現過程、主要內容、主要工具和MATLAB的快速入門操作技巧等。第2篇為技術篇,系統介紹了數據挖掘的相關技術及這些技術在量化投資中的套用,主要包括數據的準備、數據的探索、關聯規則方法、數據回歸方法、分己海烏類方法、聚類方法、預測方法、診斷方法、時間序列方法、智慧型最佳化方法等內容。第3篇為實踐篇,主要介紹數據挖掘技術在量化投資中的綜合套用實例,包括統計套利策略的挖掘與最佳化、配對交易策略的挖掘與實現、基於Wind數據的程式化交易、基於Quantrader平台的量化投資、趨勢跟蹤策略及實現過程,以及基於數據挖掘技術的量化交易系統的構建。本書的讀者對象為從事投資、數據挖掘、數據分析、數據管理工作的專業人士;金融、經濟、管理、統計等專業的教師和學再擊獄生;希望學習MATLAB的廣大再戶求科研人員、學者和工海主承程技術人員。

圖書目錄

第夜汗祖她1篇 基礎篇
第1章 緒論 2
1.1 量化投資與數據挖掘的關係 2
1.1.1 什麼是量化投資 2
1.1.2 量化投資的特點 3
1.1.3 量化投資的核心――量化模型 4
1.1.4 量化模型的主要產生方法――數據
挖掘 6
1.2 數據挖掘的概念和原理 7
1.2.1 什麼是數據挖掘 7
1.2.2 數據挖掘的原理 8
1.3 數據挖掘在量化投資中的套用 9
1.3.1 巨觀經濟分析 9
1.3.2 估價 11
1.3.3 量化選股 11
1.3.4 量化擇時 11
1.3.5 算法交易 12
1.4 本章小結 13
參考文獻 13
第2章 數據挖掘的內容、過程及
工具 14
2.1 數據挖掘的內容 14
2.1.1 關聯 14
2.1.2 回歸 15
2.1.3 分類 16
2.1.4 聚類 17
2.1.5 預測 18
2.1.6 診斷 19
2.2 數據挖掘的過程 20
2.2.1 數據挖掘過程的概述 20
2.2.2 目標的定義 20
2.2.3 數據的準備 21
2.2.4 數據的探索 22
2.2.5 模型的建立 24
2.2.6 模型的評估訂炒乃協 27
2.2.7 模型的部署 28
2.3 數據挖掘工具 29
2.3.1 MATLAB 29
2.3.2 SAS 30
2.3.3 SPSS 31
2.3.4 WEKA 32
2.3.5 R 33
2.3.6 工具的比較與選擇 34
2.4 本章小結 35
參考文獻 35
第3章 MATLAB快速入門及
實用技巧 36
3.1 MATLAB快速入門 36
3.1.1 MATLAB概要 36
3.1.2 MATLAB的功能 37
3.1.3 快速入門案例 38
3.1.4 入門後的提高 45
3.2 MATLAB常用技巧 45
3.2.1 常用標點的功能 45
3.2.2 常用操作指令 45
3.2.3 指令編輯操作鍵 46
3.2.4 MATLAB中的數據類型 46
3.3 MATLAB的開發模式 47
3.3.1 命令行模式 47
3.3.2 腳本模式 47
3.3.3 面向對象模式 47
3.3.4 三種模式的配合 48
3.4 本章小結 48
第2篇 技術篇
第4章 數據的準備 51
4.1 數據的收集 51
4.1.1 認識數據 51
4.1.2 數據挖掘的數據源 52
4.1.3 數據抽樣 53
4.1.4 量化投資的數據源 54
4.1.5 從雅虎獲取交易數據 56
4.1.6 從大智慧獲取公司財務數據 58
4.1.7 從Wind中獲取高質量數據 59
4.2 數據質量分析 61
4.2.1 數據質量分析的必要性 61
4.2.2 數據質量分析的目的 61
4.2.3 數據質量分析的內容 61
4.2.4 數據質量分析的方法 62
4.2.5 數據質量分析的結果及套用 66
4.3 數據預處理 66
4.3.1 為什麼需要數據預處理 66
4.3.2 數據預處理的主要任務 67
4.3.3 數據清洗 68
4.3.4 數據集成 71
4.3.5 數據歸約 72
4.3.6 數據變換 73
4.4 本章小結 74
參考文獻 75
第5章 數據的探索 76
5.1 衍生變數 77
5.1.1 衍生變數的定義 77
5.1.2 變數衍生的原則和方法 77
5.1.3 常用的股票衍生變數 78
5.1.4 評價型衍生變數 82
5.1.5 衍生變數數據的收集與集成 83
5.2 數據的統計 84
5.2.1 基本描述性統計 85
5.2.2 分布描述性統計 86
5.3 數據可視化 86
5.3.1 基本可視化方法 86
5.3.2 數據分布形狀可視化 87
5.3.3 數據關聯情況可視化 89
5.3.4 數據分組可視化 90
5.4 樣本選擇 91
5.4.1 樣本選擇的方法 91
5.4.2 樣本選擇套用實例 91
5.5 數據降維 93
5.5.1 主成分分析(PCA)的基本原理 93
5.5.2 PCA套用實例:企業綜合實力
排序 96
5.5.3 相關係數降維 98
5.6 本章小結 99
第6章 關聯規則方法 101
6.1 關聯規則概要 101
6.1.1 關聯規則的提出背景 101
6.1.2 關聯規則的基本概念 102
6.1.3 關聯規則的分類 103
6.1.4 關聯規則挖掘常用算法 104
6.2 Apriori算法 104
6.2.1 Apriori算法的基本思想 104
6.2.2 Apriori算法的步驟 105
6.2.3 Apriori算法的實例 105
6.2.4 Apriori算法的程式實現 107
6.2.5 Apriori算法的優缺點 110
6.3 FP-Growth算法 110
6.3.1 FP-Growth算法的步驟 110
6.3.2 FP-Growth算法的實例 111
6.3.3 FP-Growth算法的優缺點 113
6.4 套用實例:行業關聯選股法 113
6.5 本章小結 114
參考文獻 115
第7章 數據回歸方法 116
7.1 一元回歸 117
7.1.1 一元線性回歸 117
7.1.2 一元非線性回歸 120
7.1.3 一元多項式回歸 124
7.2 多元回歸 125
7.2.1 多元線性回歸 125
7.2.2 多元多項式回歸 127
7.3 逐步回歸 130
7.3.1 逐步回歸的基本思想 130
7.3.2 逐步回歸的步驟 131
7.3.3 逐步回歸的MATLAB方法 131
7.4 邏輯斯蒂回歸 133
7.4.1 邏輯斯蒂回歸模型 133
7.4.2 邏輯斯蒂回歸實例 134
7.5 套用實例:多因子選股模型的
實現 136
7.5.1 多因子模型的基本思想 136
7.5.2 多因子選股模型的實現 137
7.6 本章小結 140
第8章 分類方法 141
8.1 分類方法概要 141
8.1.1 分類的概念 141
8.1.2 分類的原理 142
8.1.3 常用的分類方法 143
8.2 K-近鄰分類 143
8.2.1 K-近鄰分類的原理 143
8.2.2 K-近鄰分類的實例 145
8.2.3 K-近鄰分類的特點 147
8.3 貝葉斯分類 147
8.3.1 貝葉斯分類的原理 147
8.3.2 樸素貝葉斯分類的原理 148
8.3.3 樸素貝葉斯分類的實例 150
8.3.4 樸素貝葉斯分類的特點 150
8.4 神經網路 151
8.4.1 神經網路的原理 151
8.4.2 神經網路的實例 153
8.4.3 神經網路的特點 153
8.5 邏輯斯蒂分類 154
8.5.1 邏輯斯蒂分類的原理 154
8.5.2 邏輯斯蒂分類的實例 154
8.5.3 邏輯斯蒂分類的特點 154
8.6 判別分析 155
8.6.1 判別分析的原理 155
8.6.2 判別分析的實例 156
8.6.3 判別分析的特點 156
8.7 支持向量機(SVM) 156
8.7.1 SVM的基本思想 157
8.7.2 SVM的理論基礎 157
8.7.3 SVM的實例 159
8.7.4 SVM的特點 160
8.8 決策樹 160
8.8.1 決策樹的基本概念 160
8.8.2 決策樹建構的步驟 161
8.8.3 決策樹的實例 164
8.8.4 決策樹的特點 164
8.9 分類的評判 165
8.9.1 正確率 165
8.9.2 ROC曲線 166
8.10 套用實例:分類選股法 168
8.10.1 實例背景 168
8.10.2 實現方法 169
8.11 延伸閱讀:其他分類方法 171
8.12 本章小結 172
第9章 聚類方法 173
9.1 聚類方法概要 173
9.1.1 聚類的概念 173
9.1.2 類的度量方法 175
9.1.3 聚類方法的套用場景 176
9.1.4 聚類方法的分類 177
9.2 K-means聚類 177
9.2.1 K-means算法的原理和步驟 177
9.2.2 K-means聚類實例1:自主編程 178
9.2.3 K-means聚類實例2:集成函式 180
9.2.4 K-means算法的特點 183
9.3 層次聚類 183
9.3.1 層次聚類的原理和步驟 183
9.3.2 層次聚類的實例 185
9.3.3 層次聚類的特點 187
9.4 神經網路聚類 187
9.4.1 神經網路聚類的原理和步驟 187
9.4.2 神經網路聚類的實例 187
9.4.3 神經網路聚類的特點 188
9.5 模糊C均值(FCM)方法 188
9.5.1 模糊C均值的原理和步驟 188
9.5.2 模糊C均值方法的套用實例 189
9.5.3 模糊C均值算法的特點 190
9.6 高斯混合聚類方法 190
9.6.1 高斯混合聚類的原理和步驟 190
9.6.2 高斯聚類的實例 192
9.6.3 高斯聚類的特點 193
9.7 類別數的確定方法及實例 193
9.7.1 類別數的確定方法 193
9.7.2 類別數的確定實例 194
9.8 套用實例:股票聚類分池 196
9.8.1 聚類的目標和數據描述 196
9.8.2 實現過程 196
9.8.3 結果及分析 198
9.9 延伸閱讀 199
9.9.1 目前聚類分析研究的主要內容 199
9.9.2 SOM智慧型聚類算法 200
9.10 本章小結 201
參考文獻 201
第10章 預測方法 202
10.1 預測方法概要 202
10.1.1 預測的概念 202
10.1.2 預測的基本原理 202
10.1.3 量化投資中預測的主要內容 203
10.1.4 預測的準確度評價及影響因素 204
10.1.5 常用的預測方法 205
10.2 灰色預測 206
10.2.1 灰色預測的原理 206
10.2.2 灰色預測的實例 208
10.3 馬爾可夫預測 209
10.3.1 馬爾可夫預測的原理 209
10.3.2 馬爾可夫過程的特性 210
10.3.3 馬爾可夫預測的實例 211
10.4 套用實例:大盤走勢預測 214
10.4.1 數據的選取及模型的建立 214
10.4.2 預測過程 216
10.4.3 預測結果與分析 216
10.5 本章小結 217
參考文獻 218
第11章 診斷方法 219
11.1 離群點診斷概要 219
11.1.1 離群點診斷的定義 219
11.1.2 離群點診斷的作用 220
11.1.3 離群點診斷方法的分類 221
11.2 基於統計的離群點診斷 221
11.2.1 理論基礎 221
11.2.2 套用實例 223
11.2.3 優點與缺點 224
11.3 基於距離的離群點診斷 225
11.3.1 理論基礎 225
11.3.2 套用實例 226
11.3.3 優點與缺點 227
11.4 基於密度的離群點診斷 227
11.4.1 理論基礎 227
11.4.2 套用實例 228
11.4.3 優點與缺點 229
11.5 基於聚類的離群點診斷 230
11.5.1 理論基礎 230
11.5.2 套用實例 230
11.5.3 優點與缺點 232
11.6 套用實例:離群點診斷量化
擇時 232
11.7 延伸閱讀:新興的離群點挖掘診斷
方法 233
11.7.1 基於關聯的離群點挖掘 233
11.7.2 基於粗糙集的離群點挖掘 234
11.7.3 基於人工神經網路的離群點挖掘 234
11.8 本章小結 235
參考文獻 235
第12章 時間序列方法 236
12.1 時間序列的基本概念 236
12.1.1 時間序列的定義 236
12.1.2 時間序列的組成因素 237
12.1.3 時間序列的分類 238
12.1.4 時間序列分析方法 238
12.2 平穩時間序列分析方法 239
12.2.1 移動平均法 239
12.2.2 指數平滑法 240
12.3 季節指數預測法 240
12.3.1 季節性水平模型 240
12.3.2 季節性趨勢模型 241
12.4 時間序列模型 242
12.4.1 ARMA模型 242
12.4.2 ARIMA模型 242
12.4.3 ARCH模型 243
12.4.4 GARCH模型 243
12.5 套用實例:基於時間序列的股票
預測 244
12.6 本章小結 247
參考文獻 247
第13章 智慧型最佳化方法 248
13.1 智慧型最佳化方法概要 248
13.1.1 智慧型最佳化方法的概念 248
13.1.2 智慧型最佳化方法在量化投資領域的
作用 249
13.1.3 常用的智慧型最佳化方法 249
13.2 遺傳算法 250
13.2.1 遺傳算法的原理 250
13.2.2 遺傳算法的步驟 251
13.2.3 遺傳算法的實例 257
13.2.4 遺傳算法的特點 258
13.3 模擬退火算法 259
13.3.1 模擬退火算法的原理 259
13.3.2 模擬退火算法的步驟 260
13.3.3 模擬退火算法的實例 262
13.3.4 模擬退火算法的特點 267
13.4 套用實例:組合投資最佳化 268
13.4.1 問題描述 268
13.4.2 求解過程 268
13.5 延伸閱讀:其他智慧型方法 269
13.5.1 粒子群算法 269
13.5.2 蟻群算法 271
13.6 本章小結 272
參考文獻 272
第3篇 實踐篇
第14章 統計套利策略的挖掘與
最佳化 274
14.1 統計套利策略概述 274
14.1.1 統計套利的定義 274
14.1.2 統計套利策略的基本思想 274
14.1.3 統計套利策略挖掘的方法 275
14.2 基本策略的挖掘 276
14.2.1 準備數據 276
14.2.2 探索交易策略 276
14.2.3 驗證交易策略 277
14.2.4 選擇最佳的參數 278
14.2.5 參數掃描方法 279
14.2.6 考慮交易費 281
14.3 高頻交易策略及最佳化 282
14.3.1 高頻交易的基本思想 282
14.3.2 高頻交易的實現 284
14.4 多交易信號策略的組合及最佳化 286
14.4.1 多交易信號策略 286
14.4.2 交易信號的組合最佳化機理 287
14.4.3 交易信號的組合最佳化實現 288
14.5 本章小結 290
參考文獻 291
第15章 配對交易策略的挖掘與
實現 292
15.1 配對交易概述 292
15.1.1 配對交易的定義 292
15.1.2 配對交易的特點 293
15.1.3 配對選取步驟 293
15.2 協整檢驗的理論基礎 294
15.2.1 協整關係的定義 294
15.2.2 EG兩步協整檢驗法 295
15.2.3 Johansen協整檢驗法 295
15.3 配對交易的實現 296
15.3.1 協整檢驗的實現 296
15.3.2 配對交易函式 297
15.3.3 協整配對中的參數最佳化 300
15.4 延伸閱讀:配對交易的三要素 301
15.4.1 配對交易的前提 301
15.4.2 配對交易的關鍵 301
15.4.3 配對交易的假設 301
15.5 本章小結 302
參考文獻 302
第16章 基於Wind數據的程式化
交易 303
16.1 程式化交易概述 303
16.1.1 程式化交易的定義 303
16.1.2 程式化交易的實現過程 304
16.1.3 程式化交易的分類 305
16.2 數據的處理及探索 306
16.2.1 獲取股票日交易數據 306
16.2.2 計算指標 309
16.2.3 數據標準化 315
16.2.4 變數篩選 316
16.3 模型的建立及評估 318
16.3.1 股票預測的基本思想 318
16.3.2 模型的訓練及評價 318
16.4 組合投資的最佳化 321
16.4.1 組合投資的理論基礎 321
16.4.2 組合投資的實現 323
16.5 程式化交易的實施 327
16.6 本章小結 327
參考文獻 328
第17章 基於Quantrader平台的
量化投資 329
17.1 量化平台概述 329
17.1.1 量化平台現狀 329
17.1.2 Quantrader平台的構成 330
17.1.3 Quantrader的工作流程 331
17.2 基於Quantrader平台的量化實現
過程 331
17.2.1 獲取交易數據 331
17.2.2 計算衍生變數 333
17.2.3 數據標準化 333
17.2.4 變數優選 333
17.2.5 訓練模型 334
17.2.6 策略回測 334
17.3 延伸閱讀:Quantrader平台的
拓展 335
第18章 趨勢跟蹤策略及實現過程 338
18.1 趨勢跟蹤策略簡介 338
18.2 趨勢跟蹤策略的基本設定 339
18.2.1 策略準則的設定 339
18.2.2 策略主要參數的設定 340
18.2.3 有效突破的設定 340
18.3 均線-收盤價策略的實現過程 340
18.3.1 均線-收盤價策略的MATLAB
實現 341
18.3.2 參數討論 343
18.4 雙均線策略 343
18.4.1 雙均線策略的MATLAB實現 343
18.4.2 參數討論 345
18.5 上升支撐線策略 346
18.5.1 上升支撐線策略的MATLAB
實現 347
18.5.2 參數討論 349
18.6 下跌壓力線策略 349
18.6.1 下跌壓力線策略的MATLAB
實現 349
18.6.2 參數討論 351
18.7 本章小結 352
第19章 基於數據挖掘技術的量化交易
系統 353
19.1 交易系統概述 353
19.1.1 交易系統的定義 353
19.1.2 交易系統的作用 354
19.2 DM交易系統總體設計 355
19.2.1 系統目標 355
19.2.2 相關約定 355
19.2.3 系統結構 355
19.3 短期交易子系統 356
19.3.1 子系統功能描述 356
19.3.2 數據預處理模組 356
19.3.3 量化選股模組 356
19.3.4 策略回測模組 357
19.4 中長期交易子系統 357
19.4.1 子系統功能描述 357
19.4.2 導入數據模組 357
19.4.3 投資組合最佳化模組 358
19.5 系統的拓展與展望 359
19.6 本章小結 360
3.1.1 MATLAB概要 36
3.1.2 MATLAB的功能 37
3.1.3 快速入門案例 38
3.1.4 入門後的提高 45
3.2 MATLAB常用技巧 45
3.2.1 常用標點的功能 45
3.2.2 常用操作指令 45
3.2.3 指令編輯操作鍵 46
3.2.4 MATLAB中的數據類型 46
3.3 MATLAB的開發模式 47
3.3.1 命令行模式 47
3.3.2 腳本模式 47
3.3.3 面向對象模式 47
3.3.4 三種模式的配合 48
3.4 本章小結 48
第2篇 技術篇
第4章 數據的準備 51
4.1 數據的收集 51
4.1.1 認識數據 51
4.1.2 數據挖掘的數據源 52
4.1.3 數據抽樣 53
4.1.4 量化投資的數據源 54
4.1.5 從雅虎獲取交易數據 56
4.1.6 從大智慧獲取公司財務數據 58
4.1.7 從Wind中獲取高質量數據 59
4.2 數據質量分析 61
4.2.1 數據質量分析的必要性 61
4.2.2 數據質量分析的目的 61
4.2.3 數據質量分析的內容 61
4.2.4 數據質量分析的方法 62
4.2.5 數據質量分析的結果及套用 66
4.3 數據預處理 66
4.3.1 為什麼需要數據預處理 66
4.3.2 數據預處理的主要任務 67
4.3.3 數據清洗 68
4.3.4 數據集成 71
4.3.5 數據歸約 72
4.3.6 數據變換 73
4.4 本章小結 74
參考文獻 75
第5章 數據的探索 76
5.1 衍生變數 77
5.1.1 衍生變數的定義 77
5.1.2 變數衍生的原則和方法 77
5.1.3 常用的股票衍生變數 78
5.1.4 評價型衍生變數 82
5.1.5 衍生變數數據的收集與集成 83
5.2 數據的統計 84
5.2.1 基本描述性統計 85
5.2.2 分布描述性統計 86
5.3 數據可視化 86
5.3.1 基本可視化方法 86
5.3.2 數據分布形狀可視化 87
5.3.3 數據關聯情況可視化 89
5.3.4 數據分組可視化 90
5.4 樣本選擇 91
5.4.1 樣本選擇的方法 91
5.4.2 樣本選擇套用實例 91
5.5 數據降維 93
5.5.1 主成分分析(PCA)的基本原理 93
5.5.2 PCA套用實例:企業綜合實力
排序 96
5.5.3 相關係數降維 98
5.6 本章小結 99
第6章 關聯規則方法 101
6.1 關聯規則概要 101
6.1.1 關聯規則的提出背景 101
6.1.2 關聯規則的基本概念 102
6.1.3 關聯規則的分類 103
6.1.4 關聯規則挖掘常用算法 104
6.2 Apriori算法 104
6.2.1 Apriori算法的基本思想 104
6.2.2 Apriori算法的步驟 105
6.2.3 Apriori算法的實例 105
6.2.4 Apriori算法的程式實現 107
6.2.5 Apriori算法的優缺點 110
6.3 FP-Growth算法 110
6.3.1 FP-Growth算法的步驟 110
6.3.2 FP-Growth算法的實例 111
6.3.3 FP-Growth算法的優缺點 113
6.4 套用實例:行業關聯選股法 113
6.5 本章小結 114
參考文獻 115
第7章 數據回歸方法 116
7.1 一元回歸 117
7.1.1 一元線性回歸 117
7.1.2 一元非線性回歸 120
7.1.3 一元多項式回歸 124
7.2 多元回歸 125
7.2.1 多元線性回歸 125
7.2.2 多元多項式回歸 127
7.3 逐步回歸 130
7.3.1 逐步回歸的基本思想 130
7.3.2 逐步回歸的步驟 131
7.3.3 逐步回歸的MATLAB方法 131
7.4 邏輯斯蒂回歸 133
7.4.1 邏輯斯蒂回歸模型 133
7.4.2 邏輯斯蒂回歸實例 134
7.5 套用實例:多因子選股模型的
實現 136
7.5.1 多因子模型的基本思想 136
7.5.2 多因子選股模型的實現 137
7.6 本章小結 140
第8章 分類方法 141
8.1 分類方法概要 141
8.1.1 分類的概念 141
8.1.2 分類的原理 142
8.1.3 常用的分類方法 143
8.2 K-近鄰分類 143
8.2.1 K-近鄰分類的原理 143
8.2.2 K-近鄰分類的實例 145
8.2.3 K-近鄰分類的特點 147
8.3 貝葉斯分類 147
8.3.1 貝葉斯分類的原理 147
8.3.2 樸素貝葉斯分類的原理 148
8.3.3 樸素貝葉斯分類的實例 150
8.3.4 樸素貝葉斯分類的特點 150
8.4 神經網路 151
8.4.1 神經網路的原理 151
8.4.2 神經網路的實例 153
8.4.3 神經網路的特點 153
8.5 邏輯斯蒂分類 154
8.5.1 邏輯斯蒂分類的原理 154
8.5.2 邏輯斯蒂分類的實例 154
8.5.3 邏輯斯蒂分類的特點 154
8.6 判別分析 155
8.6.1 判別分析的原理 155
8.6.2 判別分析的實例 156
8.6.3 判別分析的特點 156
8.7 支持向量機(SVM) 156
8.7.1 SVM的基本思想 157
8.7.2 SVM的理論基礎 157
8.7.3 SVM的實例 159
8.7.4 SVM的特點 160
8.8 決策樹 160
8.8.1 決策樹的基本概念 160
8.8.2 決策樹建構的步驟 161
8.8.3 決策樹的實例 164
8.8.4 決策樹的特點 164
8.9 分類的評判 165
8.9.1 正確率 165
8.9.2 ROC曲線 166
8.10 套用實例:分類選股法 168
8.10.1 實例背景 168
8.10.2 實現方法 169
8.11 延伸閱讀:其他分類方法 171
8.12 本章小結 172
第9章 聚類方法 173
9.1 聚類方法概要 173
9.1.1 聚類的概念 173
9.1.2 類的度量方法 175
9.1.3 聚類方法的套用場景 176
9.1.4 聚類方法的分類 177
9.2 K-means聚類 177
9.2.1 K-means算法的原理和步驟 177
9.2.2 K-means聚類實例1:自主編程 178
9.2.3 K-means聚類實例2:集成函式 180
9.2.4 K-means算法的特點 183
9.3 層次聚類 183
9.3.1 層次聚類的原理和步驟 183
9.3.2 層次聚類的實例 185
9.3.3 層次聚類的特點 187
9.4 神經網路聚類 187
9.4.1 神經網路聚類的原理和步驟 187
9.4.2 神經網路聚類的實例 187
9.4.3 神經網路聚類的特點 188
9.5 模糊C均值(FCM)方法 188
9.5.1 模糊C均值的原理和步驟 188
9.5.2 模糊C均值方法的套用實例 189
9.5.3 模糊C均值算法的特點 190
9.6 高斯混合聚類方法 190
9.6.1 高斯混合聚類的原理和步驟 190
9.6.2 高斯聚類的實例 192
9.6.3 高斯聚類的特點 193
9.7 類別數的確定方法及實例 193
9.7.1 類別數的確定方法 193
9.7.2 類別數的確定實例 194
9.8 套用實例:股票聚類分池 196
9.8.1 聚類的目標和數據描述 196
9.8.2 實現過程 196
9.8.3 結果及分析 198
9.9 延伸閱讀 199
9.9.1 目前聚類分析研究的主要內容 199
9.9.2 SOM智慧型聚類算法 200
9.10 本章小結 201
參考文獻 201
第10章 預測方法 202
10.1 預測方法概要 202
10.1.1 預測的概念 202
10.1.2 預測的基本原理 202
10.1.3 量化投資中預測的主要內容 203
10.1.4 預測的準確度評價及影響因素 204
10.1.5 常用的預測方法 205
10.2 灰色預測 206
10.2.1 灰色預測的原理 206
10.2.2 灰色預測的實例 208
10.3 馬爾可夫預測 209
10.3.1 馬爾可夫預測的原理 209
10.3.2 馬爾可夫過程的特性 210
10.3.3 馬爾可夫預測的實例 211
10.4 套用實例:大盤走勢預測 214
10.4.1 數據的選取及模型的建立 214
10.4.2 預測過程 216
10.4.3 預測結果與分析 216
10.5 本章小結 217
參考文獻 218
第11章 診斷方法 219
11.1 離群點診斷概要 219
11.1.1 離群點診斷的定義 219
11.1.2 離群點診斷的作用 220
11.1.3 離群點診斷方法的分類 221
11.2 基於統計的離群點診斷 221
11.2.1 理論基礎 221
11.2.2 套用實例 223
11.2.3 優點與缺點 224
11.3 基於距離的離群點診斷 225
11.3.1 理論基礎 225
11.3.2 套用實例 226
11.3.3 優點與缺點 227
11.4 基於密度的離群點診斷 227
11.4.1 理論基礎 227
11.4.2 套用實例 228
11.4.3 優點與缺點 229
11.5 基於聚類的離群點診斷 230
11.5.1 理論基礎 230
11.5.2 套用實例 230
11.5.3 優點與缺點 232
11.6 套用實例:離群點診斷量化
擇時 232
11.7 延伸閱讀:新興的離群點挖掘診斷
方法 233
11.7.1 基於關聯的離群點挖掘 233
11.7.2 基於粗糙集的離群點挖掘 234
11.7.3 基於人工神經網路的離群點挖掘 234
11.8 本章小結 235
參考文獻 235
第12章 時間序列方法 236
12.1 時間序列的基本概念 236
12.1.1 時間序列的定義 236
12.1.2 時間序列的組成因素 237
12.1.3 時間序列的分類 238
12.1.4 時間序列分析方法 238
12.2 平穩時間序列分析方法 239
12.2.1 移動平均法 239
12.2.2 指數平滑法 240
12.3 季節指數預測法 240
12.3.1 季節性水平模型 240
12.3.2 季節性趨勢模型 241
12.4 時間序列模型 242
12.4.1 ARMA模型 242
12.4.2 ARIMA模型 242
12.4.3 ARCH模型 243
12.4.4 GARCH模型 243
12.5 套用實例:基於時間序列的股票
預測 244
12.6 本章小結 247
參考文獻 247
第13章 智慧型最佳化方法 248
13.1 智慧型最佳化方法概要 248
13.1.1 智慧型最佳化方法的概念 248
13.1.2 智慧型最佳化方法在量化投資領域的
作用 249
13.1.3 常用的智慧型最佳化方法 249
13.2 遺傳算法 250
13.2.1 遺傳算法的原理 250
13.2.2 遺傳算法的步驟 251
13.2.3 遺傳算法的實例 257
13.2.4 遺傳算法的特點 258
13.3 模擬退火算法 259
13.3.1 模擬退火算法的原理 259
13.3.2 模擬退火算法的步驟 260
13.3.3 模擬退火算法的實例 262
13.3.4 模擬退火算法的特點 267
13.4 套用實例:組合投資最佳化 268
13.4.1 問題描述 268
13.4.2 求解過程 268
13.5 延伸閱讀:其他智慧型方法 269
13.5.1 粒子群算法 269
13.5.2 蟻群算法 271
13.6 本章小結 272
參考文獻 272
第3篇 實踐篇
第14章 統計套利策略的挖掘與
最佳化 274
14.1 統計套利策略概述 274
14.1.1 統計套利的定義 274
14.1.2 統計套利策略的基本思想 274
14.1.3 統計套利策略挖掘的方法 275
14.2 基本策略的挖掘 276
14.2.1 準備數據 276
14.2.2 探索交易策略 276
14.2.3 驗證交易策略 277
14.2.4 選擇最佳的參數 278
14.2.5 參數掃描方法 279
14.2.6 考慮交易費 281
14.3 高頻交易策略及最佳化 282
14.3.1 高頻交易的基本思想 282
14.3.2 高頻交易的實現 284
14.4 多交易信號策略的組合及最佳化 286
14.4.1 多交易信號策略 286
14.4.2 交易信號的組合最佳化機理 287
14.4.3 交易信號的組合最佳化實現 288
14.5 本章小結 290
參考文獻 291
第15章 配對交易策略的挖掘與
實現 292
15.1 配對交易概述 292
15.1.1 配對交易的定義 292
15.1.2 配對交易的特點 293
15.1.3 配對選取步驟 293
15.2 協整檢驗的理論基礎 294
15.2.1 協整關係的定義 294
15.2.2 EG兩步協整檢驗法 295
15.2.3 Johansen協整檢驗法 295
15.3 配對交易的實現 296
15.3.1 協整檢驗的實現 296
15.3.2 配對交易函式 297
15.3.3 協整配對中的參數最佳化 300
15.4 延伸閱讀:配對交易的三要素 301
15.4.1 配對交易的前提 301
15.4.2 配對交易的關鍵 301
15.4.3 配對交易的假設 301
15.5 本章小結 302
參考文獻 302
第16章 基於Wind數據的程式化
交易 303
16.1 程式化交易概述 303
16.1.1 程式化交易的定義 303
16.1.2 程式化交易的實現過程 304
16.1.3 程式化交易的分類 305
16.2 數據的處理及探索 306
16.2.1 獲取股票日交易數據 306
16.2.2 計算指標 309
16.2.3 數據標準化 315
16.2.4 變數篩選 316
16.3 模型的建立及評估 318
16.3.1 股票預測的基本思想 318
16.3.2 模型的訓練及評價 318
16.4 組合投資的最佳化 321
16.4.1 組合投資的理論基礎 321
16.4.2 組合投資的實現 323
16.5 程式化交易的實施 327
16.6 本章小結 327
參考文獻 328
第17章 基於Quantrader平台的
量化投資 329
17.1 量化平台概述 329
17.1.1 量化平台現狀 329
17.1.2 Quantrader平台的構成 330
17.1.3 Quantrader的工作流程 331
17.2 基於Quantrader平台的量化實現
過程 331
17.2.1 獲取交易數據 331
17.2.2 計算衍生變數 333
17.2.3 數據標準化 333
17.2.4 變數優選 333
17.2.5 訓練模型 334
17.2.6 策略回測 334
17.3 延伸閱讀:Quantrader平台的
拓展 335
第18章 趨勢跟蹤策略及實現過程 338
18.1 趨勢跟蹤策略簡介 338
18.2 趨勢跟蹤策略的基本設定 339
18.2.1 策略準則的設定 339
18.2.2 策略主要參數的設定 340
18.2.3 有效突破的設定 340
18.3 均線-收盤價策略的實現過程 340
18.3.1 均線-收盤價策略的MATLAB
實現 341
18.3.2 參數討論 343
18.4 雙均線策略 343
18.4.1 雙均線策略的MATLAB實現 343
18.4.2 參數討論 345
18.5 上升支撐線策略 346
18.5.1 上升支撐線策略的MATLAB
實現 347
18.5.2 參數討論 349
18.6 下跌壓力線策略 349
18.6.1 下跌壓力線策略的MATLAB
實現 349
18.6.2 參數討論 351
18.7 本章小結 352
第19章 基於數據挖掘技術的量化交易
系統 353
19.1 交易系統概述 353
19.1.1 交易系統的定義 353
19.1.2 交易系統的作用 354
19.2 DM交易系統總體設計 355
19.2.1 系統目標 355
19.2.2 相關約定 355
19.2.3 系統結構 355
19.3 短期交易子系統 356
19.3.1 子系統功能描述 356
19.3.2 數據預處理模組 356
19.3.3 量化選股模組 356
19.3.4 策略回測模組 357
19.4 中長期交易子系統 357
19.4.1 子系統功能描述 357
19.4.2 導入數據模組 357
19.4.3 投資組合最佳化模組 358
19.5 系統的拓展與展望 359
19.6 本章小結 360

相關詞條

熱門詞條

聯絡我們