內容簡介
巨觀經濟風險的監測預警是國家審計工作的重點內容之一。隨著大數據時代的到來,大數據審計代替傳統審計已成為大勢所趨。《面向巨觀經濟風險的監測預警指標體系構建與建模》旨在將大數據和大數據分析方法與巨觀經濟指標建模研究相結合,建立面向巨觀經濟風險的監測預警指標體系,並開展基於經濟大數據的方法體系與案例研究。本《面向巨觀經濟風險的監測預警指標體系構建與建模》的成果有重要的科學意義和實踐指導價值。一方面,通過大數據技術構建的巨觀經濟指標體系是巨觀經濟風險監測預警的有力工具;另一方面,基於自然語言處理和機器學習的方法論及實踐研究將推動大數據技術方法在巨觀經濟研究中的套用。
圖書目錄
目錄
第1章 緒論 1
第2章 巨觀經濟指標庫的構建及套用 3
2.1 巨觀經濟指標庫的數據來源 3
2.1.1 政府維度 3
2.1.2 市場維度 3
2.1.3 民眾生活維度 4
2.1.4 規範化文本維度 4
2.2 巨觀經濟指標庫的構建流程 4
2.2.1 基於國家統計局的巨觀經濟指標 6
2.2.2 基於文本數據加工的巨觀經濟指標 6
2.2.3 基於教科書及中文文獻庫的巨觀經濟指標 7
2.2.4 多數據源巨觀經濟指標合併及經濟分類 8
2.3 巨觀經濟指標庫的驗證及結構分析 8
2.3.1 巨觀經濟指標庫的驗證 8
2.3.2 巨觀經濟指標庫的結構分析 9
2.4 巨觀經濟指標庫的套用分析 11
2.4.1 套用實例一:多源文本的經濟主題分析 11
2.4.2 套用案例二:省區市政府工作報告的主題時間序列分析 15
第3章 經濟指標建模的一般性方法(一):混頻指標短期預測 27
3.1 引言 27
3.2 混頻LSTM模型 28
3.2.1 問題定義 28
3.2.2 整體模型架構 29
3.2.3 分離特徵模型 29
3.2.4 組合特徵模型 30
3.2.5 稀疏正則化 31
3.2.6 數據增強 31
3.3 數據實驗 32
3.3.1 數據集 32
3.3.2 結果對比 33
3.3.3 旁證數據的影響 34
3.3.4 變數貢獻度 34
3.4 結論和討論 36
第4章 經濟指標建模的一般性方法(二):不均衡樣本的學習方法 37
4.1 引言 37
4.2 文獻綜述 38
4.2.1 樣本選擇偏差與遷移學習 38
4.2.2 基於傾向分數的加權 38
4.2.3 基於特徵匹配的加權 39
4.2.4 基於整體分布的加權 39
4.3 算法設計 40
4.4 實驗過程及結果 43
4.4.1 實驗數據 43
4.4.2 實驗算法 44
4.4.3 實驗結果 44
4.5 結論 46
第5章 增長指標建模案例:GDP預測建模 47
5.1 引言 47
5.2 研究概況 47
5.3 數據 48
5.3.1 GDP 48
5.3.2 解釋變數 49
5.3.3 樣本構造 50
5.4 模型簡介 52
5.4.1 LASSO回歸模型 52
5.4.2 SVR模型 52
5.4.3 RNN系列模型 53
5.5 實驗 54
5.6 結論 56
第6章 穩定指標建模案例:就業與失業指標預測建模 57
6.1 引言 57
6.2 數據與描述性統計 59
6.2.1 個人層面的全樣本行政數據 59
6.2.2 數據的預處理 60
6.3 模型構建 61
6.3.1 模型算法 61
6.3.2 樣本構建 62
6.3.3 特徵分析與特徵工程 63
6.3.4 基於個人層面預測的失業率計算 67
6.4 模型結果與分析 68
6.4.1 個人就業狀態預測結果 68
6.4.2 特徵重要性與模型解釋 70
6.4.3 基於行政大數據的失業率預測 72
6.4.4 就業失業動態 72
6.4.5 性別與結構性失業 73
6.4.6 就業/失業人口文化程度結構 74
6.5 結論 74
第7章 民生指標建模方法研究一:人口遷入與新增確診人數趨勢關係分析 76
7.1 疫情數據初步分析 76
7.1.1 一代與非一代病例情況對比 76
7.1.2 深圳市病例數分析 78
7.2 人口遷入與新增確診人數的趨勢關係及因果量化分析 79
7.2.1 格蘭傑因果關係檢驗簡介 79
7.2.2 疫情建模方法 81
7.2.3 量化分析結果 82
7.3 研究結論與方法總結 83
第8章 民生指標建模方法研究二:新增確診人數估計的機率模型 84
8.1 引言 84
8.2 疫情數據初步分析 85
8.3 每日新增感染人數 86
8.3.1 符號說明 86
8.3.2 基本假設 87
8.3.3 似然函式 87
8.3.4 EM算法 88
8.3.5 每日新增感染人數的分析與討論 88
8.4 基於參數Bootstrap方法的每日新增感染人數的區間估計 89
8.4.1 參數Bootstrap方法 89
8.4.2 數值分析結果 89
8.5 研究結論與方法總結 92
第9章 民生指標建模方法研究三:動態傳播率模型及其在疫情分析中的套用 93
9.1 引言 93
9.2 動態傳播率模型 94
9.3 動態傳播率的函式擬合 96
9.4 動態傳播率的疫情變化估計 99
9.4.1 疫情變化估計的方法介紹 99
9.4.2 疫情變化估計的滑窗期選擇 99
9.5 研究結論與方法總結 100
第10章 民生指標建模方法研究四:基於動態增長率模型的疫情分析 102
10.1 引言 102
10.2 動態增長率模型 102
10.2.1 動態增長率模型的提出 102
10.2.2 動態增長率模型的計算 103
10.2.3 動態增長率模型與疫情變化估計 104
10.2.4 動態增長率模型擬合函式選擇 104
10.3 研究結論與方法總結 106
參考文獻 107