機器學習在算法交易中的套用(第2版)

《機器學習在算法交易中的套用(第2版)》是2023年中國水利水電出版社出版的算法交易類圖書,作者是史蒂芬·詹森。

基本介紹

  • 中文名:機器學習在算法交易中的套用(第2版)
  • 作者:史蒂芬·詹森
  • 譯者:郭天鵬、唐麗君、賈康
  • 出版時間:2023年1月
  • 出版社:中國水利水電出版社
  • 頁數:592 頁
  • ISBN:9787522606910 
  • 類別:機器學習、算法交易
  • 定價:158 元
  • 開本:16 開
內容簡介,圖書目錄,作者簡介,

內容簡介

人工智慧時代,數字數據的爆炸式增長推動了人們對使用機器學習(ML)的交易策略相關知識的需求。《機器學習在算法交易中的套用(第2版)》就以Python為基本工具,從全局、戰略的視角介紹了相關的概念,以及機器學習在交易策略設計和執行中的價值及實踐運用。全書分4部分,其中第1部分主要介紹基於機器學習的交易策略的基礎知識,該部分內容圍繞機器學習算法以及交易策略相關的數據展開,概述了如何有效捕獲數據信號內容、如何準確提取特徵,以及如何基於這些數據最佳化算法評估投資組合。第2部分重點闡述了在端到端工作流環境中,一些基本的監督學習、無監督學習是如何為交易策略的制定提供幫助的。第3部分是自然語言處理,這部分引入了無監督學習算法,力求從文本數據這種最關鍵的另類數據中高質量地提取信號。第4部分通過TensorFlow和PyTorch,重點介紹深度學習和強化學習在交易策略設計中的套用。
《機器學習在算法交易中的套用(第2版)》通過大量示例,詳細介紹了如何使用不同機器學習算法設計交易策略,並通過大量的數學及統計知識,幫助讀者更好地理解算法調優過程及整個計算過程。特別適合想獲得用於交易的機器學習算法相關知識或想設計交易策略的數據分析師、數據科學家、Python開發人員、投資分析師或投資組合經理參考學習。

圖書目錄

第 1 部分 數據、阿爾法因子和投資組合
第 1 章 機器學習在交易中的套用——從夢想到現實
1.1 機器學習在投資行業的興起
1.1.1 從電子交易到高頻交易
1.1.2 因子投資與智慧型貝塔基金
1.1.3 初露崢嶸——算法先驅更勝一籌
1.1.4 機器學習與另類數據
1.1.5 眾包算法交易
1.2 基於機器學習的交易策略的設計與執行
1.2.1 數據源和數據管理
1.2.2 從阿爾法因子研究到投資組合管理
1.2.3 策略回測
1.3 機器學習在交易中的套用——策略與用途
1.3.1 算法交易策略的演進
1.3.2 交易中的機器學習用途
1.4 本章小結
第 2 章 市場和基本面數據——數據源和數據技能
2.1 市場數據反映市場環境
2.1.1 市場微觀結構——基本要點
2.1.2 交易是如何進行的——不同類型的交易訂單
2.1.3 交易是在哪裡執行的——從交易所交易到暗池交易
2.2 高頻數據處理
2.2.1 納斯達克訂單簿數據處理
2.2.2 通過 FIX 協定進行交易
2.2.3 美股 Lv2 高級行情——納斯達克 TotalView ITCH 數據
2.2.4 從 tick 數據到採樣圖——市場數據處理
2.2.5 AlgoSeek 分鐘採樣——股票報價和交易數據
2.3 通過 API 訪問市場數據
2.3.1 pandas 遠程數據訪問
2.3.2 yfinance——從雅虎財經爬取數據
2.3.3 Quantopian
2.3.4 Zipline
2.3.5 Quandl
2.3.6 其他數據提供商
2.4 基本面數據處理
2.4.1 財務報表數據
2.4.2 其他基本面數據源
2.5 pandas 高效存儲數據
2.6 本章小結
第 3 章 金融另類數據——分類和用例
3.1 另類數據革命
3.2 另類數據源
3.2.1 個人產生的數據
3.2.2 商業過程數據
3.2.3 感測器數據
3.3 另類數據評價標準
3.3.1 信號內容質量
3.3.2 數據質量
3.3.3 技術考量
3.4 另類數據市場
3.5 處理另類數據
3.5.1 爬取 OpenTable 數據
3.5.2 收集和分析收入財報會議記錄
3.6 本章小結
第 4 章 金融特徵工程——阿爾法因子研究
4.1 現實中的阿爾法因子——從數據到信號
4.2 因子研究這幾十年
4.2.1 動量和情緒——與趨勢為友
4.2.2 價值因子——立足基本面,發掘便宜貨
4.2.3 波動率和規模異常
4.2.4 量化投資質量因子
4.3 預測收益的阿爾法因子工程
4.3.1 使用 pandas 和 NumPy設計因子
4.3.2 基於 TA-Lib 創建技術阿爾法因子
4.3.3 利用卡爾曼濾波器對阿爾法因子進行降噪處理
4.4 從信號到交易—Zipline 回測
4.4.1 單因子策略回測
4.4.2 不同數據源因子組合
4.5 基於 Alphalens 從噪聲中分離信號
4.5.1 創建預期收益和因子分位數
4.5.2 用因子信號五分位數預測性能
4.5.3 信息係數
4.5.4 因子周轉率
4.6 阿爾法因子資源庫
4.7 本章小結
第 5 章 投資組合的最佳化和評估
5.1 衡量投資組合表現
5.1.1 風險收益權衡單值指標
5.1.2 主動管理基本法則
5.2 投資組合風險收益管理
5.2.1 現代投資組合管理的演變
5.2.2 均值-方差最佳化
5.2.3 均值-方差最佳化的替代方案
5.2.4 風險平價法
5.2.5 風險因子投資
5.2.6 分層風險平價
5.3 基於 Zipline 的投資組合交易和管理
5.3.1 信號生成和交易執行
5.3.2 均值-方差組合最佳化實現
5.3.3 基於 pyfolio 的回測性能測量
5.3.4 前向測試—樣本外收益預測
5.4 本章小結
第 2 部分 機器學習在交易中的基本套用
第 6 章 機器學習過程
6.1 基於數據進行機器學習
6.1.1 挑戰—算法與任務的匹配
6.1.2 監督學習—青出於藍而勝於藍
6.1.3 無監督學習—於無聲處聽驚雷
6.1.4 強化學習——越挫越勇越強大
6.2 機器學習工作流
6.2.1 基本操作—K 近鄰
6.2.2 確定問題—從目標到指標
6.2.3 數據收集和準備
6.2.4 特徵的探索、提取和工程處理
6.2.5 設計和調整模型
6.2.6 使用交叉驗證選擇模型
6.2.7 交叉驗證的 Python 實現
6.2.8 交叉驗證在金融領域套用的挑戰
6.2.9 基於 scikit-learn 和 Yellowbrick調整參數
6.3 本章小結
第 7 章 線性模型——從風險因子到收益預測
7.1 從推斷到預測
7.2 基線模型——多元線性回歸
7.2.1 構建模型
7.2.2 訓練模型
7.2.3 高斯-馬爾可夫定理
7.2.4 統計推斷
7.2.5 診斷和解決問題
7.3 實踐中的線性回歸
7.3.1 基於 statsmodels 的 OLS
7.3.2 基於 sklearn 的隨機梯度下降算法
7.4 建立線性因子模型
7.4.1 從 CAPM 到 Fama-French因子模型
7.4.2 獲取風險因子
7.4.3 Fama-Macbeth 回歸
7.5 用收縮率正則化線性回歸
7.5.1 避免過度擬合
7.5.2 嶺回歸原理
7.5.3 套索回歸原理
7.6 用線性回歸預測收益
7.6.1 準備模型特徵和預期收益
7.6.2 基於 statsmodels 的線性OLS 回歸
7.6.3 基於 scikit-learn 的線性回歸
7.6.4 基於 scikit-learn 的嶺回歸
7.6.5 基於 sklearn 的套索回歸
7.6.6 預測信號質量比較
7.7 線性分類
7.7.1 邏輯回歸模型
7.7.2 基於 statsmodels 的推斷
7.7.3 邏輯回歸預測物價變動
7.8 本章小結
第 8 章 ML4T 工作流——從建模到策略回測
8.1 對機器學習驅動的策略進行回測
8.2 回測“陷阱”及避陷妙招
8.2.1 正確獲取數據
8.2.2 正確模擬仿真
8.2.3 正確統計數據
8.3 回測引擎工作機理
8.3.1 向量化回測與事件驅動回測
8.3.2 關鍵實現
8.4 backtrader—一個用於本地回測的靈活工具
8.4.1 backtrader 的 Cerebro 架構的關鍵概念
8.4.2 backtrader 實踐運用
8.4.3 backtrader 小結與展望
8.5 Zipline——Quantopian 可擴展性回測
8.5.1 穩健模擬的日曆和管道
8.5.2 使用分鐘數據創建Bundle
8.5.3 管道 API——回測機器學習信號
8.5.4 在回測過程中訓練模型
8.6 本章小結
第 9 章 時間序列模型在波動預測和統計套利中的套用
9.1 特徵診斷和提取工具
9.1.1 時間序列模式分解
9.1.2 滾動視窗統計和移動平均
9.1.3 度量自相關
9.2 平穩性診斷和實現
9.2.1 時間序列平穩變換
9.2.2 用著手處理代替思考
9.2.3 實踐中的時間序列變換
9.3 一元時間序列模型
9.3.1 自回歸建模
9.3.2 移動平均建模
9.3.3 ARIMA 模型構建和擴展
9.3.4 巨觀基本面預測
9.3.5 利用時間序列模型預測波動率
9.4 多元時間序列模型
9.4.1 方程組
9.4.2 向量自回歸模型
9.4.3 基於 VAR 模型的巨觀預測
9.5 協整——具有共同趨勢的時間序列
9.5.1 Engle-Granger 兩步法
9.5.2 Johansen 似然比檢驗
9.6 協整統計套利
9.6.1 選擇和交易配對資產組合
9.6.2 實踐中的配對交易
9.6.3 策略回測準備
9.6.4 backtrader 策略回測
9.6.5 擴展——做得更好
9.7 本章小結
第 10 章 貝葉斯機器學習算法——動態夏普比率和配對交易
10.1 貝葉斯機器學習工作機理
10.1.1 如何根據經驗證據更新假設
10.1.2 精確推斷——最大後驗估計
10.1.3 確定近似推斷與隨機近似推斷
10.2 使用 PyMC3 進行機率編程
10.2.1 基於 Theano 的貝葉斯機器學習
10.2.2 PyMC3 工作流程——預測衰退
10.3 交易中的貝葉斯機器學習算法
10.3.1 貝葉斯夏普比率性能比較
10.3.2 配對交易的貝葉斯滾動回歸
10.3.3 隨機波動率模型
10.4 本章小結
第 11 章 隨機森林算法——日本股票的多空策略
11.1 決策樹——從數據中學習規則
11.1.1 樹的學習和決策規則
11.1.2 實踐中的決策樹
11.1.3 過度擬合與正則化
11.1.4 超參數調優
11.2 隨機森林——使決策樹更可靠
11.2.1 模型集成表現得更好的原因
11.2.2 自助聚合
11.2.3 建立隨機森林
11.2.4 訓練和調整隨機森林
11.2.5 隨機森林的特徵重要性
11.2.6 袋外測試
11.2.7 隨機森林的優缺點
11.3 日本股市的多空信號
11.3.1 數據——日本股票
11.3.2 ML4T 工作流與LightGBM
11.3.3 基於 Zipline 的策略設計和回測
11.4 本章小結
第 12 章 交易策略的提升
12.1 “熱身”——適應性提升
12.1.1 AdaBoost 算法
12.1.2 AdaBoost 預測月度價格變動
12.2 梯度提升——大任務模型集成
12.2.1 GBM 模型的訓練與調優
12.2.2 基於 sklearn 的梯度提升
12.3 XGBoost、LightGBM 和CatBoost
12.4 提升算法在多空交易策略中的套用
12.4.1 基於 LightGBM 和 CatBoost產生信號
12.4.2 黑盒解密——GBM 結果闡釋
12.4.3 基於提升模型集成的交易策略回測
12.4.4 經驗教訓和展望
12.5 日內策略提升
12.5.1 高頻數據特徵工程
12.5.2 LightGBM 分鐘頻率信號
12.5.3 交易信號質量評估
12.6 本章小結
第 13 章 數據驅動的風險因子與基於無監督學習的資產配置
13.1 降維
13.1.1 維數詛咒
13.1.2 線性降維
13.1.3 流形學習——非線性降維
13.2 PCA 在交易中的套用
13.2.1 數據驅動的風險因子
13.2.2 特徵組合Eigenportfolios
13.3 聚類
13.3.1 K-均值聚類
13.3.2 層次聚類
13.3.3 密度聚類
13.3.4 高斯混合模型
13.4 層次聚類在投資組合最佳化中的套用
13.4.1 HRP 的工作機理
13.4.2 機器學習交易策略回測 HRP
13.5 本章小結
第 3 部分 自然語言處理
第 14 章 與交易相關的文本數據——情感分析
14.1 機器學習與文本數據—從語言到特徵
14.2 從文本到 token—NLP 管道
14.3 token 計數——文檔術語矩陣
14.4 交易中的自然語言處理
14.5 本章小結
第 15 章 主題模型——財經新聞摘要
15.1 潛在主題學習——目標與方法
15.2 機率潛在語義分析
15.3 潛在狄利克雷分布
15.4 財報電話會議主題建模
15.5 財經新聞主題建模
15.6 本章小結
第 16 章 詞嵌入——財報會議和SEC 檔案的數位化
16.1 詞嵌入編碼語義的過程
16.2 預訓練詞向量套用
16.3 財經新聞自定義嵌入
16.4 word2vec—與 SEC 檔案進行交易
16.5 基於 doc2vec 嵌入的情感分析
16.6 新領域—預訓練轉換器模型
16.7 本章小結
第 4 部分 深度學習和強化學習
第 17 章 深度學習在交易中的套用
17.1 深度學習的新增功能及其重要性
17.2 神經網路設計
17.3 基於 Python 從零開始構建神經網路
17.4 常用的深度學習庫
17.5 多空策略神經網路最佳化
17.6 本章小結
第 18 章 卷積神經網路算法在金融時間序列和衛星圖像處理中的套用
18.1 卷積神經網路如何學習建模格線狀數據
18.2 卷積神經網路在衛星圖像和目標檢測中的套用
18.3 時序數據卷積神經網路套用——預測收益
18.4 本章小結
第 19 章 循環神經網路算法在多變數時間序列和情感分析中的套用
19.1 循環神經網路的工作機理
19.2 基於 TensorFlow 2 的時間序列循環神經網路套用
19.3 循環神經網路在文本數據處理中的套用
19.4 本章小結
第 20 章 自編碼器在條件風險因子和資產定價中的套用
20.1 自編碼器在非線性特徵提取中的套用
20.2 基於 TensorFlow 2 的自編碼器實現
20.3 條件自編碼器在交易中的套用
20.4 本章小結
第 21 章 生成式對抗網路在合成時間序列數據中的套用
21.1 使用生成式對抗網路創建合成數據
21.1.1 比較生成模型和判別模型
21.1.2 對抗性訓練—零和遊戲
21.1.3 生成式對抗網路“動物園式野蠻生長”
21.1.4 生成式對抗網路在圖像和時間序列數據中的套用
21.2 基於 TensorFlow 2 構建生成式對抗網路
21.2.1 構建生成器網路
21.2.2 構建判別器網路
21.2.3 設定對抗性訓練過程
21.3 時間序列生成式對抗網路在合成金融數據中的套用
21.3.1 學習跨特徵和時間生成數據
21.3.2 基於 TensorFlow 2 的TimeGAN 實現
21.3.3 合成時間序列數據質量評價
21.4 本章小結
第 22 章 深度強化學習——打造交易機器人
22.1 強化學習要素
22.2 解決強化學習問題
22.1.1 解決強化學習問題時的關鍵挑戰
22.2.2 解決強化學習問題的基本方法
22.3 動態規劃問題求解
22.3.1 有限馬爾可夫決策問題
22.3.2 策略疊代
22.3.3 價值疊代
22.3.4 廣義策略疊代
22.3.5 基於 Python 的動態規劃
22.4 Q 學習—尋找最優策略“在路上”
22.4.1 探索與開發——𝛆–貪婪策略
22.4.2 Q 學習算法
22.4.3 使用 Python 訓練Q 學習機器人
22.5 基於 OpenAI Gym 的深度強化學習交易套用
22.5.1 神經網路價值函式逼近
22.5.2 深度 Q 學習算法及其擴展
22.5.3 使用 TensorFlow 2 實現雙重深度 Q 學習
22.5.4 創建一個簡單的交易機器人
22.5.5 自定義 OpenAI 交易環境設計
22.5.6 深度 Q 學習在股票市場中的套用
22.6 本章小結
第 23 章 結論與展望
23.1 重要的經驗教訓
23.1.1 數據是最重要的組成部分
23.1.2 專業性——從噪聲中分辨信號
23.1.3 機器學習是一個用於解決數據問題的工具包
23.1.4 模型診斷有助於加快最佳化
23.1.5 “沒有免費的午餐”
23.1.6 管理偏差和方差之間的權衡
23.1.7 謹防回測過度擬合
23.1.8 洞見黑盒
23.2 實際交易中的機器學習
23.2.1 關鍵數據管理技術
23.2.2 機器學習工具
23.2.3 網路交易平台
23.3 本章小結
附錄 A 阿爾法因子庫
A.1 基於TA-Lib 的常見阿爾法因子
A.1.1 關鍵構建模組——移動平均線
A.1.2 重疊指標研究——價格和波動趨勢
A.1.3 動量指標
A.1.4 成交量指標和流動性指標
A.1.5 波動率指標
A.1.6 基本面風險因子
A.2 WorldQuant 的夢想——公式化阿爾法
A.2.1 操作橫截面函式和時間序列數據的函式
A.2.2 公式化阿爾法表達式
A.3 雙變數和多變數因子評估
A.3.1 信息係數和互信息
A.3.2 特徵重要性和SHAP 值
A.3.3 比較—每個指標的前25 個特徵
A.3.4 財務績效—Alphalens

作者簡介

史蒂芬·詹森(Stefan Jansen)
Stefan Jansen是 Applied AI公司的創始人兼執行長。他為財富500強公司、投資公司和各行各業的初創企業提供數據和人工智慧戰略方面的建議,並組建數據科學團隊,為廣泛的商業問題開發端到端的機器學習解決方案。
創業之前,他是一家國際投資公司的合伙人和董事總經理,在那裡他進行了大量的預測分析和投資研究實踐。他還曾是一家在15個市場開展業務的全球性金融科技公司的高級管理人員,為新興市場的中央銀行及世界銀行提供諮詢服務。
Stefan Jansen擁有喬治亞理工學院的計算機科學碩士學位以及哈佛大學和柏林自由大學的經濟學碩士學位,並獲得了CFA認證。他曾在歐洲、亞洲和美洲使用六種語言工作,並在Datacamp和GeneralAssembly 教授數據科學。

相關詞條

熱門詞條

聯絡我們