《超高維數據中若干檢驗問題的研究》是依託東北師範大學,由馮龍擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:超高維數據中若干檢驗問題的研究
- 項目類別:青年科學基金項目
- 項目負責人:馮龍
- 依託單位:東北師範大學
項目摘要,結題摘要,
項目摘要
高維數據分析是近年來統計學研究中的熱點。隨著科技的發展,實際中收集的一些數據的維數越來越高,大大的超過了樣本量,比如基因數據,航空數據,金融數據等。由於維數比樣本量大,這就導致傳統的統計分析方法失效。這就需要新的統計分析法來處理高維數據的相關問題。本項目將深入研究高維數據中若干檢驗問題,包括高維單樣本均值檢驗,高維兩樣本均值檢驗,高維球形檢驗等。現有的很多方法都是基於發散因子模型或者多元常態分配假設下開發的,從而並不穩健。本項目基於空間符號統計量、空間秩統計量等方法期望可以提出一些新的檢驗方法,並套用於實際領域。
結題摘要
高維數據分析是統計學近年來非常熱點的問題。它不僅在理論上具有重要意義,在實際領域,如基因分析,航空航天,金融,工程等也具有重大的套用價值。特別是近十年來,實際套用領域的發展和需要使得統計學家開發出很多新的理論和方法。例如,在基因數據中,人們常常需要從成千上萬個基因中找出最重要的幾個基因。本項目主要研究內容有:1. 充分利用變數之間相關性的高維樣本均值檢驗方法;2. 基於空間符號統計量的高維單樣本均值檢驗問題; 3. 基於空間符號統計量的高維兩樣本均值檢驗問題;4. 基於空間秩統計量的高維兩樣本均值檢驗問題;5. 高維Spearman’s rho和Kendall’s tau球型檢驗方法。本項目針對以上研究內容給出了不同問題下的不同檢驗方法,並證明了他們的理論性質,且在實際數據中有一定的套用。本項目按原計畫進行,在上述各方面及相關領域都有較深入的研究,已 經取得系列的科研成果,完成了預期目標。在本項目資助下,已在國際 SCI 檢索期刊(包括統計學頂級期刊 Journal of American Statistical Association)上發表論文 8篇。另外,還有多篇文章在投或修改之中。