《高維數據的穩健統計分析及相關問題》是依託中國科學院數學與系統科學研究院,由張健擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:高維數據的穩健統計分析及相關問題
- 項目類別:青年科學基金項目
- 項目負責人:張健
- 依託單位:中國科學院數學與系統科學研究院
- 負責人職稱:工程師
- 申請代碼:A0401
- 研究期限:1995-01-01 至 1997-12-31
- 批准號:19401037
- 支持經費:2.4(萬元)
《高維數據的穩健統計分析及相關問題》是依託中國科學院數學與系統科學研究院,由張健擔任項目負責人的青年科學基金項目。
《高維數據的穩健統計分析及相關問題》是依託中國科學院數學與系統科學研究院,由張健擔任項目負責人的青年科學基金項目。項目摘要樣本崩潰點是用來量度一個統計方法承受數據污染的能力。它是穩健統計中最重要概念之一。重降M估計是常用...
穩健統計是數理統計學的一個方面,研究當總體假定稍有變動及記錄數據有失誤時,統計方法的適應性問題。一個統計方法在實際套用中要有良好的表現,需要兩個條件:一是該方法所依據的條件與實際問題中的條件相符;二是樣本確是隨機的,不...
《高維問題和穩健性研究》是依託北京師範大學,由金蛟擔任項目負責人的青年科學基金項目。項目摘要 對於兩樣本均值檢驗問題, 當p/n→y, y 接近1時,BS檢驗統計量比Hotelling's T^2 檢驗統計量有顯著好的功效。本項目研究當p遠遠...
在現代社會,信息量以及套用信息的程度都以幾何級數的方式在增長,這些海量信息大多可以表示成高維數據的形式,因此高維數據分析是當今數理統計發展最重要的方向之一。本項目將從三個方面較系統的研究高維數據問題。一是高維情形下回歸設計的...
對於超高維線性模型,我們將研究基於加權Wilcoxon型估計的穩健變數掃描方法。利用U過程理論,我們將建立該方法的sure screening 性質,並利用此方法來研究超高維部分線性模型的穩健變數掃描問題。我們將通過模擬和實際數據分析來驗證所提方法的...
對複雜數據(包括不完全和完全統計數據)進行穩健統計分析已受到人們的廣泛關注。本項目則致力於複雜數據的穩健統計推斷及其問題的研究,包括:1. 給出帶有隨機截斷加權的刻度(方差)估計,探討它們的高崩潰點、高效率及其漸近性質。2. ...
《高維數據統計方法、理論與套用》是2018年9月國防工業出版社出版的圖書,作者是(瑞士)彼得·布爾曼、(瑞士)薩拉范德·吉爾。內容簡介 全書共分14章:第1章對本書的主要內容進行概述;第2章介紹線性模型中的Lasso;第3章介紹廣義...
《 Python高維數據分析》2020年08月是西安電子科技大學出版社出版的圖書,作者趙煜輝,本書從矩陣計算如特徵值分解和奇異值分解出發,闡述了正規方程的最小二乘法模型引出欠秩線性方程組的求解方法問題和兩種有損的降維方法。內容簡介 本...
我們研究的主要內容是探討了當前十分熱門的大維數據分析問題,創新之處是將高維隨機矩陣譜理論套用於大維數據統計分析問題,對經典的似然比檢驗作出必要而有效的修正,和經典多元統計方法以及其他一些高維數據分析方法相比較,得到更為有效的不...
本項目致力於穩健變數選擇研究及其高維數據分析問題的研究,對若干常用統計模型特別是(部分)線性(EV)模型,研究當誤差分布或因變數的分布偏離了理論假定分布時,採用懲罰最小二乘,LASSO,SCAD等變數選擇方法,對變數選擇和參數估計的影響...
在我們前期工作基於基因信息提取的互動熵信息收益方法以及基於人臉識別的小樣本BOOTSTRAP PCA降維技術的基礎上,本項目擬系統研究生物特徵識別這一實際問題中高維數據降維的前沿統計方法和算法:帶異常干擾線性生物數據的穩健降維及算法;非線性...
對高維數據建模成為越來越普遍的問題。高維數據的一個特點是信號弱,噪音大。已有的高維數據分析方法中,對穩健性的考慮還不充分。本項目重點是考慮高維數據建模中的穩健降維方法,針對不同的套用背景發展相應的統計方法,研究其理論性質並...
這些數據不僅維數很高,而且具有強噪聲、強相依性和強非線性等特點。如何對這些複雜高維數據進行統計建模和分析是非常重要而且又極具挑戰性的一類問題,也是發展統計學的極好機遇。本項目擬研究高維數據的建模與分析中急待解決的若干問題,...
本項目以高維相關數據分析為背景,針對關聯結構的理論、方法和套用問題開展研究。理論上主要探討關聯結構描述高維相關數據相關性的機理以及關聯結構中典型統計量的估計問題。方法上,一方面,研究基於維數約簡的高維相關數據關聯結構構建方法,另...
本項目致力於給出高維數據下的半參數回歸模型的穩健統計推斷和變數選擇方法,從而解決經濟、醫學和生物等領域的高維數據分析問題。高維半參數模型的統計分析通常要考慮參數個數發散的情形,有時甚至參數個數是樣本個數的多項式級或指數級,...
這就需要新的統計分析法來處理高維數據的相關問題。本項目將深入研究高維數據中若干檢驗問題,包括高維單樣本均值檢驗,高維兩樣本均值檢驗,高維球形檢驗等。現有的很多方法都是基於發散因子模型或者多元常態分配假設下開發的,從而並不穩健...
從本項目提出的指紋相似性檢索問題出發,我們通過對高維特徵的數據分布建模分析,對包括指紋識別在內的生物特徵查詢如何同時保障系統準確性、高效性、安全性及可靠性進行研究。主要研究內容包括指紋特徵空間分布統計模型、高維指紋特徵的緊湊二...
解決了可變分組數卡方檢驗的相合性基本理論問題,並給出了檢驗統計量和相應的卡方隨機變數的K-S距離的收斂速率。這些新的高維複雜數據的分析方法已套用於CT檢測成像降噪,金融數據模型分析、GWAS、癌症等數據分析中去,得到了良好的效果,...
《高維數據分析預處理技術》是2015年祝琴創作的圖書。內容簡介 作者針對高維稀疏數據挖掘問題,從數據預處理的角度,研究對象—屬性空間的劃分問題,其目的是把所研究的數據挖掘空間分解為若干規模較小的對象—屬性空間,從而降低實際數據挖掘...
它具有穩健性、抗干擾性和準確度高等優點,因而在許多領域得到廣泛套用。投影尋蹤產生背景 隨著科技的發展,高維數據的統計分析越來越普遍,也越來越重要.多元分析方法是解決高維數據這類問題的有力工具。但傳統的多元分析方法是建立在總體...
2013年任山西醫科大學公共衛生學院院長,兼衛生統計學教研室主任。主要成就 科研成就 研究方向 穩健估計、高維數據分析,因果推斷方法及醫學科研套用。學術研究 主要研究興趣為穩健估計、高維數據分析與因果推斷等方法及其在流行病學研究中的...