面板數據分位數回歸中的模型選擇問題研究

中文摘要

本課題主要研究面板數據（面板個數n，面板長度T）分位數回歸中的模型選擇問題。主要研究內容有：一、研究n固定、T發散的情況，通過複合分位數回歸(CQR)提高估計效率，並用ALASSO進行變數選擇，證明理論性質；二、研究n發散、T固定的情況，利用QIF方法考慮相關結構，結合CQR，提高估計效率，並通過ALASSO進行變數選擇，證明理論性質；三、研究n發散、T固定的高維面板數據，利用QIF方法考慮相關結構，採用LASSO和ALASSO兩步懲罰的方法，研究降維和模型選擇問題；四、研究帶刪失的情形，考慮到CQR要求誤差同分布的局限，利用自適應LASSO對不同分位數水平上的係數差異進行懲罰，確定係數之間確實存在差異的分位數水平，選擇正確的模型，提高估計效率。同時，在本課題的研究中，將通過豐富的計算機模擬,檢驗所提方法的有限樣本性質，並將方法套用到實際問題分析中去。

結題摘要

面板數據、刪失數據、分位數回歸與模型選擇以及它們的各種組合是統計研究中非常重要的內容。本課題主要研究內容和重要結果如下。一、帶相依誤差項的複合分位數回歸中的變數選擇：對比OLS，CQR相對效率有一致下界，誤差項來自厚尾分布時，相對效率可遠超過1；估計量有變數選擇相合性；為所複合分位數的個數選擇提供依據。二、縱向數據分位數回歸中的估計效率的改進：對條件分位數回歸進行經驗似然估計，個體內部分位數得分函式的相關矩陣的逆用QIF近似，得到個體的權重，進行加權估計；個體內部有一定相關性，誤差項來自厚尾或不對稱分布時，比現有方法更有效。三、固定刪失數據在超高維分位數回歸中的降維和變數選擇：先對廣義線性回歸進行降維估計刪失機率，後結合信息子集和懲罰方法進行兩階段降維和變數選擇；變數選擇相合，非零係數收斂速度最優。四、隨機刪失數據中，通過懲罰方法自動檢測自變數對回響變數各個分位數水平的影響的一致性：自適應LASSO和自適應Sup-norm均具有選擇的相合性；先用自適應Sup-norm判定所有分位數水平上共同性，後對有差異的自變數利用自適應LASSO分段選擇共同性。五、加速生命測試數據中的穩健分位數回歸：為加速生命測試（ALT）數據提供分位數回歸方法；與傳統參數模型相比，我們不假設參數分布，數據固定刪失時計算有效，靈活建模；可處理無失效個體ALT數據。六、刪失數據分位數回歸中由門限值效應引起的變點檢驗：使用逆機率加權對參數進行估計；檢驗統計量基於次梯度函式，臨界值用自助法近似；第一類錯誤接近名義水平，功效快速趨於1。七、線性分位數回歸中的序貫變點檢測：假定在一批歷史數據中，係數結構沒有變化，對接下來的數據採用基於次梯度函式的CUSUM-型檢驗。八、保險費率厘定中的風險因子選擇——零膨脹-泊松回歸模型中的EM自適應LASSO變數選擇方法：假定理賠次數服從零膨脹的泊松分布；EM自適應LASSO具有變數選擇相合性，包括零膨脹部分和泊松部分。九、單指標複合分位數回歸中的參數檢驗和非參數函式的線性檢驗：所構造的參數部分檢驗統計量與非參數函式的檢驗統計量均具有卡方性。十、OU型過程中的連續廣義矩LASSO型估計量：以非零機率把零參數估計為零；數值結果顯示，有很大的機率選擇正確的結構。科學意義：在統計理論上做出了貢獻，為實際數據分析提供了合適的方法。

面板數據分位數回歸中的模型選擇問題研究

基本介紹

中文摘要

結題摘要

相關詞條

熱門詞條