《高維數據下的模型平均方法》是依託中國科學院數學與系統科學研究院,由張新雨擔任項目負責人的面上項目。
基本介紹
- 中文名:高維數據下的模型平均方法
- 項目類別:面上項目
- 項目負責人:張新雨
- 依託單位:中國科學院數學與系統科學研究院
《高維數據下的模型平均方法》是依託中國科學院數學與系統科學研究院,由張新雨擔任項目負責人的面上項目。
《高維數據下的模型平均方法》是依託中國科學院數學與系統科學研究院,由張新雨擔任項目負責人的面上項目。項目摘要隨著現代科技的迅速發展,大量的複雜高維數出現在經濟、金融、生命科學和信息科學等領域。現有的高維數據分析方法幾乎都...
本項目研究高維數據下變數選擇過程的不確定性對模型預測的影響程度,並通過模型平均方法提高模型的預測穩定性。我們擬採用多次拆分數據的方法,構造候選模型集合,並用每個候選模型的預測值和原數據的因變數構造一個新的數據。然後使用新數據...
在高維情形下,當均值受到另一組高維協變數影響時,我們用似然函式加懲罰的方法來估計無向圖的結構。用懲罰似然方法研究array-型數據的無向圖模型估計。對於高維有向圖(DAG)採用基於約束的學習方法,其中關鍵的步驟是高維條件獨立性檢驗...
研究非凸懲罰估計的算法,給出算法的收斂性質與統計性質,並在此基礎上研究高維模型平均方法、參數的假設檢驗和區間估計等;研究高維線性模型參數高效率的穩健估計方法;研究高維計算機實驗數據的建模方法,並給出模型的推斷和預報方法。
二是在收集的高維數據具有稀疏性情況下,套用當前流行的SCAD和MCP等大規模數據模型選擇方法,在模型選擇的同時對多變點進行更加快速有效的檢測。三是當高維數據不具有稀疏性情形下,研究具有相依結構的大維隨機矩陣極限譜分布,進而研究由譜...
提出了隨機分割模型平均方法獲得高維線性模型的平穩預報;對廣義線性模型和廣義線性混合效應模型,基於 Kullback-Leibler 損失提出了頻率模型平均估計中權重的選擇準則,並在理論上證明了其漸近最優性,從而將主要適用於連續觀測數據的最優模型...
本項目主要是通過構建高維數據聚類的具有一定通用性的數學模型,來研究和開發適用於海量高維數據聚類分析的有效方法和工具。我們主要開展以下研究工作:(1)研究從高維數據空間中有效提取候選子空間的方法;(2)研究子空間聚類的數學模型,該...
這些數據的維數已經達到成千上萬,背景知識相當複雜,很難從整體上表示各個變數間錯綜複雜的關係。目前,分析這些高維數據的最有效工具之一是圖模型。它可清晰地表示問題的背景知識及變數間的結構關係,是高維數據統計建模的非常自然的方式。
為解決高維數據流的實時性數據挖掘問題,本項目改進並設立了穩定的增量極端學習機分類器,使得數據挖掘模型的疊代和測試速度都顯著增加。同時,針對高維數據流的概念漂移問題,本項目提出了利用子空間投影技術對新數據塊進行概念漂移的檢測的...
《高維數據統計方法、理論與套用》是2018年9月國防工業出版社出版的圖書,作者是(瑞士)彼得·布爾曼、(瑞士)薩拉范德·吉爾。內容簡介 全書共分14章:第1章對本書的主要內容進行概述;第2章介紹線性模型中的Lasso;第3章介紹廣義...
本項目主要致力於用半參數回歸模型對高維數據進行統計分析,其主要研究成果有一下幾方面:第一,研究了缺失回響變數下單指標模型的統計推斷,發展了一種糾偏方法來估計指標係數,提出了兩種加權的經驗對數似然比統計量,其漸近分布是標準卡...
廣義相對誤差估計理論,構建了乘法回歸模型中增維參數的經驗似然置信區間;構造了線性回歸模型中誤差項方差的刀切經驗似然置信區間;Lorenz占優的檢驗問題,提出了Lorenz曲線差值的刀切經驗似然推斷方法;構建了高維數據情形下,非光滑U-型...
在科研的很多前沿領域,函式型數據分析方法已經開始取代傳統方法,並結合能夠跟隨時間或空間變化的動態模型,逐漸成為分析高維數據和高維信號的強有力手段。目前的函式型數據模型主要是基於函式型主成分分析的線性模型,本項研究將致力於建立...
《化學計量學中高維數據的統計學習方法》是依託中南大學,由許青松擔任項目負責人的面上項目。項目摘要 本項目以化學計量學中的建立定量結構與活性關係模型為目的,對高維化學數據的統計學習的進行系統研究,其中特別是對多種中藥揮髮油的...
在此基礎上,基於層次張量的維度融合表達和維度分層結構,研究面向時空過程的動態數據的張量分解與重構的計算模式,構建普適的、多維融合的高維地理時空場數據分析與高效計算方法,實現傳統地理分析方法在層次張量模型下的對接與重構,從而為...
大規模高維多示例數據分類是智慧型醫療、生物信息學等現代信息工程亟待解決的一個共性問題。本項目從數據潛在語義角度研究高維多示例數據分類的新模型和新方法,以解決傳統方法存在的距離測度無效、學習假設不合理等問題,是分類模型研究的語義...
首先,本項目擬從模型的識別性、估計的有效性和變數選擇這三方面對高維縱向數據下的廣義部分線性單指標模型進行研究,擬借鑑廣義估計方程的思想提出估計方法並研究其有效性,進而提出能同時進行參數估計和變數選擇的方法,證明變數選擇的相合...
此外,我們也研究協變數缺失時降維技術,在無須對傾向性得分函式作模型假設下發展降維技術。結題摘要 缺失數據普遍發生在一些實際問題的研究中。本項目研究數據缺失時高維數據分析的方法、理論與套用。研究了協變數缺失時非參數降維問題,...
新型的遺傳數據給傳統的統計方法提出了挑戰。本項目以複雜疾病基因定位研究中期待解決的問題為驅動,以高維罕見變異遺傳數據的統計分析為目的,致力於構建新的統計模型與算法,並把其套用到實際數據分析中。我們具體研究了三部分內容:1)不...
《一些新方法在高維數據中的套用》是依託中國科學院數學與系統科學研究院,由朱力行擔任項目負責人的面上項目。項目摘要 為了有效地進行高維數據的統計分析,一些新方法被用於在分布理論、回歸分析、半參數模型的統計推斷中,切片逆回歸方面...
與此同時,還研究了函式型變數的M估計以及變數選擇問題,對函式型數據和多元協變數混合的回歸模型進行理論探索;第四,對複雜類型數據的關聯分析、聚類分析以及模糊聚類的距離範式進行了研究,在高維度數據的餘弦相似度計算方面,提出了“...
本項目將結合指紋識別研究經驗和先進的高維數據分析方法,將方向場離散數據轉化為函式表示,然後利用函式特性來研究方向場特徵變化關聯的典型模式及其在現場指紋殘缺方向場重建和真、假指紋形變模型中的套用。本項目立足於生物安全和統計分析的...
這主要是因為,一方面,無監督聚類分析難以提供用戶期望的數據分組,極大地影響對數據的理解。另一方面,由於高維數據存在“維數詛咒”問題,通常會造成分類模型出現過學習現象和計算複雜度偏高。目前研究者正主要通過以下兩種途徑進行重點研究,...
本項目研究在機器學習的背景下,實現高維數據的特徵選擇。主要是針對四個方面的研究:量子進化算法的改進;基於量子進化算法的高維特徵選擇;基於模型組合的高維特徵選擇;基於特徵選擇方法可靠性的模型診斷。針對高維數據進行特徵選擇,有利於...
研究的主要模型為幾種常見的非參數可加模型和半參數模型。在方法上,主要研究自適應的參數和非參數兩步估計、無窮維討厭參數的估計插入後的估計函式的糾偏技術以及對應的高維數據模型的降維方法。要達到的具體目是:1.在模型函式估計方面,...
針對以上問題,本項目擬 (1)基於高維地理數據特徵提取,從流形學習及模型聚類研究入手,提出新的降維與聚類方法;(2)通過耦合地理距離和屬性距離,提出一種新的空間數據分析距離概念及其有效估測算法;(3) 結合前述的距離概念和新...
(3)基於自適應非顯式隱私維度保護的新型高斯混合聚類算法,用於解決單源高維數據的最優聚類模型學習問題;(4)基於局部模型參數融合的全局聚類算法,用於解決大規模、多源高維數據的最優聚類模型學習問題。