《高維數據下的一些統計檢驗問題的研究》是依託華東師範大學,由徐進擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:高維數據下的一些統計檢驗問題的研究
- 項目類別:青年科學基金項目
- 項目負責人:徐進
- 依託單位:華東師範大學
- 批准號:10701036
- 申請代碼:A0401
- 負責人職稱:教授
- 研究期限:2008-01-01 至 2010-12-31
- 支持經費:18(萬元)
《高維數據下的一些統計檢驗問題的研究》是依託華東師範大學,由徐進擔任項目負責人的青年科學基金項目。
《高維數據下的一些統計檢驗問題的研究》是依託華東師範大學,由徐進擔任項目負責人的青年科學基金項目。項目摘要隨著當今以基因晶片(microarray)為代表的高通量生物信息技術的飛速發展,傳統的統計科學面對著高維數據環境下...
《超高維數據中若干檢驗問題的研究》是依託東北師範大學,由馮龍擔任項目負責人的青年科學基金項目。項目摘要 高維數據分析是近年來統計學研究中的熱點。隨著科技的發展,實際中收集的一些數據的維數越來越高,大大的超過了樣本量,比如基因數據,航空數據,金融數據等。由於維數比樣本量大,這就導致傳統的統計分析方法...
《高維半參數回歸模型中的若干檢驗問題》是依託深圳大學,由張君擔任項目負責人的青年科學基金項目。項目摘要 高維數據在近20 多年來一直是統計學研究的重要問題之一,因其常常出現在醫學,經濟學,工程學等實際工作與研究領域而備受關注。本項目將重點研究高維半參數模型中的一些檢驗問題,模型主要包括高維單指標模型與...
《高維數據統計分析中的若干前沿課題》是依託中國科學技術大學,由吳耀華擔任項目負責人的面上項目。中文摘要 本項目主要致力於處理高維數據的統計方法和理論的研究,它們包括變數選擇,建模,統計推斷和計算.在這些問題中,數據的維數和數據量均很大,現在處理一般數據的統計方法均可能會遇到一些諸如存在系統偏差,漸近分布不同...
《高維數據的穩健統計分析及相關問題》是依託中國科學院數學與系統科學研究院,由張健擔任項目負責人的青年科學基金項目。項目摘要 樣本崩潰點是用來量度一個統計方法承受數據污染的能力。它是穩健統計中最重要概念之一。重降M估計是常用的位置估計,其崩潰特性沒有得到系統研究。本研究證明重降M估計樣本崩潰點強收斂而且...
本項目將從三個方面較系統的研究高維數據問題。一是高維情形下回歸設計的若干問題,將套用Hadamard矩陣和其他一些矩陣的正交結構尋找最優設計,從而在收集高維數據時既可以包含足夠的信息又可以極大地減少人力、物力、成本花費等。二是在收集的高維數據具有稀疏性情況下,套用當前流行的SCAD和MCP等大規模數據模型選擇方法,...
在理論研究的基礎上,開發基於R語言的程式算法,同時用隨機模擬和實例分析來驗證這些新方法的可行性和有效性。本項目的研究不僅拓廣了高維數據分析的理論,而且進一步推進了統計學在生物醫學中的套用,具有較高的理論價值和廣闊的套用前景。結題摘要 本研究項目針對高維檢驗中的熱點問題和高維數據的稀疏性特點,在高維...
本項目系統研究了生物特徵識別這一實際問題中高維數據降維的前沿統計方法和算法,具體包括:(1)帶異常干擾線性生物數據的穩健降維及算法。使用協方差矩陣的多種穩健估計,例如最小協方差行列式估計(MCD)方法改進PCA、LDA數據降維方法;使用基於異常點度量的多種重構誤差方法;使用基於熵信息的高維小樣本數據處理方法...
《多元統計分析中常用統計量的高維性態研究》是依託東北師範大學,由鄭術蓉擔任項目負責人的面上項目。項目摘要 高維數據經常出現在各個領域中,分析高維數據已經成為目前國際統計界的前沿課題之一。多元分析中許多常用統計量用到高維數據中經常會出現高估真實參數或高機率拒絕原假設的問題,嚴重的時候甚至會出現估計的偏...
第三,探討單回響變數互動模型和多回響變數可加模型統計推斷的途徑,主要研究模型樣條擬合估計、模型選擇與檢驗、模型偏差計算、相合性及其收斂速度等。第四,研究高維線性問題的低維非線性逼近模式與快速算法,發展高維數據降維的新方法。第五,開發高性能計算的基礎算法的統計軟體包,實現高維數據的非線性逼近和稀疏表示...
研究在高維數據情形下,圖模型的結構學習及相關統計推斷問題。在高維情形下,當均值受到另一組高維協變數影響時,我們用似然函式加懲罰的方法來估計無向圖的結構。用懲罰似然方法研究array-型數據的無向圖模型估計。對於高維有向圖(DAG)採用基於約束的學習方法,其中關鍵的步驟是高維條件獨立性檢驗。我們分別研究在有...
該課題的目的就是將傳統的統計檢驗問題與方法更新改造,並且創新,使之能夠用於大數據時代的數據分析。同時,該課題在研究過程中也會帶來統計方法與統計工具等方面的創新。結題摘要 本項目研究高維隨機向量相關結構的檢驗問題,取得如下研究結果: (1)關於高維數據的相關性檢驗: (a)提出了檢驗高維 U 統計量矩陣的...
構建了適用於高維度數據流的統計過程控制理論和方法;在時空事件的監視預警問題中,構建了一個空間地理位置數據流的多維似然比檢驗框架,在此框架下研究、比較了基於空間Bayes 假設的似然比求和方法;為了解決疾病監控問題中不同區域的敏感性不同等問題,提出了空間似然比統計量的標準化方法,並證明了各個空間似然比統計...
含多個因變數的線性回歸模型是統計學中的經典模型之一,其套用廣泛存在於各個學科中。目前國內外對高維數據情形下的該模型的研究比較欠缺。本項目研究該模型在自變數和因變數維數都遠大於樣本量的情形下的統計推斷問題。在誤差項服從多元常態分配的假設下,我們考慮以下三個問題:一是判斷誤差項的精度矩陣中各元素是否...
現有成果主要集中在低維模型的統計分析, 少有高維協變數污染數據的研究成果。 本項目擬研究高維協變數調整模型的統計推斷,並結合現代變數選擇方法,研究存在協變數污染的高維協變數調整(廣義)線性模型、部分線性模型、半參變係數部分線性模型等模型選擇問題。主要研究內容包括:1、協變數調整半參變係數模型統計推斷;2...
發展塊變數回歸 與典型相關分析和相結合的統計學習方法; 研究用幾何拓撲方法來界定出模型預測域或適用區域,使得能把握模型對新樣本預測值的可靠性。 本項目將完成化學計量學的高維數據統計學習的系列方法,為化學工作者提供有效的數據建模方法,促進統計學習的理論和方法在定量結構與活性關係研究中的套用。
我們主要考慮的問題包括高維數據的回歸分析和典則相關分析等。同時,還將相關的研究理論套用關於生物醫藥統計和無線通訊信號網路等實際當中。結題摘要 我們研究的主要內容是探討了當前十分熱門的大維數據分析問題,創新之處是將高維隨機矩陣譜理論套用於大維數據統計分析問題,對經典的似然比檢驗作出必要而有效的修正,和...
通過本項目研究,可望在理論上豐富SURE、經驗貝葉斯和經驗似然的研究,同時也拓寬其套用領域,為圖像處理、生物信息等領域提供更穩健、有效的方法。結題摘要 高維數據的統計分析在生物、經濟、環境等領域有著廣泛的套用背景。本項目基於經驗貝葉斯、Stein無偏風險估計、經驗似然等方法,對高維數據中的同時估計與統計推斷問...
本項目以複雜疾病基因定位研究中期待解決的問題為驅動,以高維罕見變異遺傳數據的統計分析為目的,致力於構建新的統計模型與算法,並把其套用到實際數據分析中。我們具體研究了三部分內容:(1)不同類型疾病變數與高維遺傳位點間關聯分析的相依多重檢驗方法;(2)罕見變異位點關聯分析的統計建模及在高維數據分析中的...
這個問題同時也具有高度的基礎研究價值。預期在三年的研究期限內每年解決一個子問題並發表研究論文。結題摘要 本研究發展了高維數據中的非參數經驗貝葉斯方法,將六十年前的經典理論運用於現代高維數據的統計推斷,後者是現在統計學界的研究熱點。Herbert Robbins於1956年提出非參數經驗貝葉斯方法。自提出後,非參數經驗...
雖然稀疏高維統計模型已有廣泛深入的研究和套用,但很少有非稀疏高維模型的研究成果。在非稀疏條件下,現有高維統計模型及其推斷方法會出現本質性的問題,如模型不可識別、變數選擇所得的子模型有偏和對應的參數估計不相合等。本項目致力於非稀疏高維統計模型的研究,主要研究內容為:1.建立非稀疏高維線性模型重建理論和方法...
這明顯的反應在統計質量控制領域,簡單的、低維的質量指標觀測被高維的、函式型的數據所取代。本項目的研究目標是將新的統計方法和問題相結合,提出新的理論方法來更有效地處理複雜數據的過程監控和診斷。 主要研究內容 (1)高維數據、函式型數據的穩健統計檢驗以及其在SPC領域的套用; (2)複雜數據中(單)多變...
《高維數據統計學:方法理論和套用》是2016年世界圖書出版公司出版的著作,作者是[瑞] Peter Bühlmann(P.布爾曼),Sara van de Geer(S.馮.吉爾)。內容簡介 Peter Bühlmann在ETHZ是高維統計、因果推斷方面的知名專家。《高維數據統計學》統計學的前沿之作。這本書所針對的高維數據,是理論研究的熱點,在實際中...
本項目期待學術上能取得一些國際高水平的研究成果,開發統計理論和技術方法為以後相關問題做出指導;期待套用上實現一定的社會價值和經濟價值,為提高我國產品質量提供技術上的指導與幫助。結題摘要 背景及科學意義隨著現代感測技術的日益普及,線上高維、離散、多數據流數據收集得以實現,對統計質量控制方法的靈活性和有效性...
《高維數據統計方法、理論與套用》是2018年9月國防工業出版社出版的圖書,作者是(瑞士)彼得·布爾曼、(瑞士)薩拉范德·吉爾。內容簡介 全書共分14章:第1章對本書的主要內容進行概述;第2章介紹線性模型中的Lasso;第3章介紹廣義線性模型中的Lasso;第4章介紹Group Lasso;第5章介紹加性模型和單變數平滑函式;...
《複雜醫療保健數據的統計推斷和過程控制》是依託四川師範大學,由劉瀏擔任項目負責人的青年科學基金項目。項目摘要 醫療保健數據的質量監控問題在統計過程控制(SPC)領域日益受到重視。傳統SPC技術一般是基於簡單低維數據及工業背景假設來進行設計。本項目研究的目標是針對一些高維、複雜、過度散布的醫療保健數據,發展相應...
它可清晰地表示問題的背景知識及變數間的結構關係,是高維數據統計建模的非常自然的方式。然而,由於圖模型中涉及的變數太多,傳統的參數估計和模型選擇方法,要么計算複雜度比較高,要么功效比較低,很難適應高維數據的情形。本項目中,我們將利用局部計算和共享計算思想求高維圖模型的極大似然估計,降低傳統的估計方法(...
著名統計學家Bickel 和Doksum的兩卷集《數理統計:基本思想與專題》,1977年首次出版,目前的這個版本將1977年第1版的擴充為現在的第1卷,第2版,並且又增加了第2卷。在過去的四十年中,數理統計發生了巨大的變化,這部作品把*前沿的數據分析和統計方法,大數據、高維統計融入高等統計的教材,包括了當下統計學的...
著名統計學家Bickel 和Doksum的兩卷集《數理統計:基本思想與專題》,1977年首次出版,目前的這個版本將1977年第1版的擴充為現在的第1卷,第2版,並且又增加了第2卷。在過去的四十年中,數理統計發生了巨大的變化,這部作品把*前沿的數據分析和統計方法,大數據、高維統計融入高等統計的教材,包括了當下統計學的一...
研究領域 感興趣的研究領域:參數估計的容許性,Fiducial推斷,假設檢驗的p-值,擬合優度檢驗,多重假設檢驗問題,Bayes推斷和頻率推斷的和諧性,高維數據降維,區間估計的條件推斷等。所授課程 本科生:機率論,數理統計,隨機過程,線性模型,統計判決函式理論,計量經濟學,機率統計(工科)。碩士研究生:機率論,...