《數據缺失時高維數據降維分析的方法、理論與套用》是依託中國科學院數學與系統科學研究院,由王啟華擔任項目負責人的面上項目。
基本介紹
- 中文名:數據缺失時高維數據降維分析的方法、理論與套用
- 項目類別:面上項目
- 項目負責人:王啟華
- 依託單位:中國科學院數學與系統科學研究院
《數據缺失時高維數據降維分析的方法、理論與套用》是依託中國科學院數學與系統科學研究院,由王啟華擔任項目負責人的面上項目。
《數據缺失時高維數據降維分析的方法、理論與套用》是依託中國科學院數學與系統科學研究院,由王啟華擔任項目負責人的面上項目。項目摘要高維數據分析是當前統計研究的熱點之一,特別是自從Li (1991,JASA)提出切片逆回歸技...
因此,基於資源約束,對高維流數據降維這一基礎性問題進行研究,設計具有理論性能保證的降維方法具有重要的理論和現實意義。本課題針對資源約束下的高維流數據降維進行研究,具體包括:1、資源約束下的流數據降維算法研究;2、基於資源約束的降維性能最佳化研究;3、流數據降維的相關套用研究。該項研究的完成一方面將為高維流...
針對目前降維方法所普遍存在的語義缺失和高度依賴樣本的問題,本項目首先在經濟管理領域數據語義分析的基礎上,研究了高維複雜數據分析的語義化問題,給出了語義的本體表達與自動化構建方法;其次,提出了完備的、準確的、系統的本體代數體系和基於本體代數的語義計算方法,並且建立了以本體代數為核心的語義高維數據降維理論...
《生物醫學數據統計分析的方法、理論與套用》是依託中國科學院數學與系統科學研究院,由王啟華擔任項目負責人的重點項目。項目摘要 本項目研究生物醫學數據包含高維或超高維數據、函式型數據、縱向數據、缺失數據及隨機刪失數據統計分析的方法、理論與套用,開展統計學與生物醫學交叉研究。具體地,我們探討生物醫學一些重要...
對高維數據建模成為越來越普遍的問題。高維數據的一個特點是信號弱,噪音大。已有的高維數據分析方法中,對穩健性的考慮還不充分。本項目重點是考慮高維數據建模中的穩健降維方法,針對不同的套用背景發展相應的統計方法,研究其理論性質並進行模擬和實際數據分析。 本項研究按照計畫展開,取得了較好的成果。共發表論文近...
本項目系統研究了生物特徵識別這一實際問題中高維數據降維的前沿統計方法和算法,具體包括:(1)帶異常干擾線性生物數據的穩健降維及算法。使用協方差矩陣的多種穩健估計,例如最小協方差行列式估計(MCD)方法改進PCA、LDA數據降維方法;使用基於異常點度量的多種重構誤差方法;使用基於熵信息的高維小樣本數據處理方法...
現有的相關研究多是雙視野數據融合,且缺乏深入的理論分析。多視野數據融合中的許多問題尚處於探索階段。本項目擬研究多視野高維複雜數據融合的方法和理論,內容包括單視野數據的穩定性理論和特點分析,同型多視野數據的協同和一致性降維, 異質多視野數據的多重圖約束線性低秩逼近, 協同稀疏表達、一致性聚類和分類,低秩...
信息檢索、生物信息計算學等領域的實際套用中常需要對高維數據進行聚類分析預處理,而無監督聚類難以提供準確快速的數據分組,極大地影響後續處理的性能。半監督聚類通過引入成對約束提供了判別信息,有助於減少不合理的劃分;進一步對數據降維,可降低過學習風險和計算複雜度。與以往先降維再學習距離測度或聚類導致最終性能...
《高維數據幾何結構及降維(英文版)》提供了所有程式的MATLAB代碼,以方便讀者計算機實現。作者簡介 王建忠,1967年畢業於北京大學數學力學系,1981年獲浙江大學套用數學系碩士學位,後執教於武漢大學並於1988年晉升為教授,現任美國德克薩斯州山姆休斯頓大學教授。主要研究方向包括:樣條和逼近理論、小波分析、圖像處理以及...
本項目主要在高維數據分析方法,分位數回歸等穩健方法以及半參數降維模型三方面開展研究。針對高維數據分析方向,開展了以下工作。首先,我們在高維協變數加速失效時間模型下研究了多數據集整合分析方法,並對方法的大樣本理論性質給出了完整嚴謹的證明。這項成果不僅總結了已有的相關研究工作,而且首次系統地研究這些方法的...
現有相關工作僅關注此類數據的單一配對或單一監督信息,忽視了對這些信息的綜合利用,從而導致性能和套用受限。本課題旨在已有工作基礎上,發展出一個能綜合利用各信息的一般性多表示數據降維框架並設計出一系列有效降維算法,以克服現有不足。整個工作圍繞建模、算法設計和實現、理論分析和實驗對比等方面系統展開。此外,...
隨著現代科學技術的發展,數據越來越凸顯高維與複雜態勢。高維數據頻繁見諸於環境科學、醫學研究、金融市場以及第二代網際網路當中。高維數據給統計學家提出巨大挑戰的同時,也給予了統計學界進一步深化發展統計理論與方法的契機。充分降維通過有效將高維變數轉化為其低維線性組合,避免了維數禍根的困擾,使得進一步統計分析...
在已有的數據聚類、檢索、文本分析以及識別等等問題的套用中,LPP方法表現出了良好的性能與套用前景。儘管如此,LPP方法也存在如下尚未解決的理論與套用缺陷:高維數據情況下,相應特徵方程不可直接求解或已有的數值求解方案會使變換結果不符合LPP的本質要求;核LPP方法變換效率低下不能滿足實際套用要求;核LPP方法參數選擇...
為了充分挖掘過程與產品兩方面的信息,本項目通過對過程變數進行特徵提取,對過程變數實現降維,基於多變數過程特徵與產品質量間的統計模型,建立過程與質量的聯合預警方法,通過監控多變數的過程特徵實現產品質量的預警。本項目的研究期望將豐富過程與產品的聯合監控研究的理論與方法,為生產製造企業產品質量的提升、生產過程的...
會議的主題是高維數據分析,主要討論與複雜大容量數據有關的理論、方法問題,主要包括統計學理論、高維數據降維和後基因數據分析以及非參數理論和方法等。2010年7月“複雜數據統計分析國際會議”。會議由雲南大學、中國科學院套用數學研究所和中國科學院隨機複雜結構與數據科學重點實驗室聯合舉辦,在中國昆明的雲南大學召開...