《高維數據統計建模與分析》是依託北京大學,由陳松蹊擔任項目負責人的重點項目。
基本介紹
- 中文名:高維數據統計建模與分析
- 依託單位:北京大學
- 項目負責人:陳松蹊
- 項目類別:重點項目
《高維數據統計建模與分析》是依託北京大學,由陳松蹊擔任項目負責人的重點項目。
《高維數據統計建模與分析》是依託北京大學,由陳松蹊擔任項目負責人的重點項目。項目摘要隨著現代數據的收集和儲存技術的提高,統計數據呈現出高維性。由於可重複研究的限制,參加研究的個體數量相對很小。這就是現代統計學中最具挑戰的...
《高維數據的半參數回歸建模與統計分析》是依託北京工業大學,由薛留根擔任項目負責人的面上項目。項目摘要 本項目主要致力於高維數據的半參數回歸建模和統計分析的研究,其研究內容包括下列五個方面。第一,發展高維數據半參數回歸模型的自適應估計方法,提出新的估計方法來消除無限維討厭參數估計和數據維數的影響,使構造...
《高維數據建模與分析的若干問題》是依託中國科學院數學與系統科學研究院,由熊世峰擔任項目負責人的面上項目。項目摘要 隨著現代科技的迅猛發展,在生命科學、信息科學、材料科學、工業工程以及經濟金融等許多領域都產生了大量的複雜高維數據。這些數據不僅維數很高,而且具有強噪聲、強相依性和強非線性等特點。如何對這些...
《高維時空場數據的層次張量建模與分析方法》是依託南京師範大學,由袁林旺擔任項目負責人的面上項目。項目摘要 地理時空場數據是表征具有連續時空變化的地理對象及地理過程的主要形式,具有高維等特點。從數學基礎上尋找高維時空場數據的代數化表達,進而有效利用抽象數學的運算空間和計算運算元進行算法構造與最佳化是提升高維...
《高維數據的穩健統計分析及相關問題》是依託中國科學院數學與系統科學研究院,由張健擔任項目負責人的青年科學基金項目。項目摘要 樣本崩潰點是用來量度一個統計方法承受數據污染的能力。它是穩健統計中最重要概念之一。重降M估計是常用的位置估計,其崩潰特性沒有得到系統研究。本研究證明重降M估計樣本崩潰點強收斂而且...
本書每章都有基於Python語言和Sklearn機器學習庫的紅外光譜數據集分析的實例。紅外光譜集是關於物質吸光率的純數據,可以與其標籤標示的數據物質濃度直接進行回歸分析,讀者在閱讀中可以把精力*限度地集中在高維數據的建模、 算法實現和分析過程上。本書既可作為信息管理和信息系統專業、 計算機相關專業和大數據專業的教學...
《高維協變數污染複雜數據的統計分析研究》是依託鄭州大學,由李鋒擔任項目負責人的聯合基金項目。項目摘要 高維協變數污染複雜數據普遍存在於生物、醫學和經濟等領域,協變數調整模型是處理此類數據的一類專有模型(Sentürk et al.2005)。現有成果主要集中在低維模型的統計分析, 少有高維協變數污染數據的研究成果。
《基於隨機矩陣理論的高維數據統計分析》是依託吉林大學,由姜丹丹擔任項目負責人的青年科學基金項目。項目摘要 隨著現代科學和計算機技術的飛速發展,高維數據出現在了諸多新興領域中。然而當維數升高時,經典統計量的極限分布不能很好地描述統計量的真實(或近似)極限性狀,或者經典理論完全失效(統計量趨於無窮)。我們的...
《高維數據統計方法、理論與套用》是2018年9月國防工業出版社出版的圖書,作者是(瑞士)彼得·布爾曼、(瑞士)薩拉范德·吉爾。內容簡介 全書共分14章:第1章對本書的主要內容進行概述;第2章介紹線性模型中的Lasso;第3章介紹廣義線性模型中的Lasso;第4章介紹Group Lasso;第5章介紹加性模型和單變數平滑函式;...
《基於廣義部分線性單指標模型的高維縱向數據統計分析》是依託上海師範大學,由許佩蓉擔任項目負責人的青年科學基金項目。項目摘要 高維縱向數據在社會學、醫學等領域中經常出現,其最大的特點是數據之間具有相關性。因此,如何在考慮數據相關性的前提下對其進行統計分析一直是近20年來統計學研究的熱點課題之一,具有十分...
對最小二乘估計的置信域進行了改進等。 該項目執行期間,項目負責人共指導研究生26名。該項目研究論文共發表7篇,接受論文2篇,其中SCI收錄4篇。這些研究成果部分解決了長記憶隨機場、高維數據及時間序列模型的估計、檢驗等統計推斷問題,對長記憶數據的建模、預測等統計分析具有很好的理論和套用價值。
《高維數據分析中的收縮估計與似然推斷》是依託蘭州大學,由李周平擔任項目負責人的面上項目。項目摘要 高維數據分析與建模是目前統計及相關領域研究的熱點。本項目擬結合收縮估計和似然推斷兩方面研究高維數據的統計分析。對於前者,我們將基於Stein無偏風險估計 (SURE) 與經驗貝葉斯的思想,構建異方差多元正態模型在分量...
從本項目提出的指紋相似性檢索問題出發,我們通過對高維特徵的數據分布建模分析,對包括指紋識別在內的生物特徵查詢如何同時保障系統準確性、高效性、安全性及可靠性進行研究。主要研究內容包括指紋特徵空間分布統計模型、高維指紋特徵的緊湊二進制碼錶示、特徵函式分析在指紋檢索中的套用以及生物特徵查詢系統的隱私保護機制。...
《經濟管理領域中的高維複雜數據分析理論與套用》是依託北京航空航天大學,由王惠文擔任項目負責人的重點項目。項目摘要 本項目將以經濟、金融與管理領域為背景,對高維複雜數據統計分析中的一些基礎性與前沿性的理論問題開展研究。通過對幾種典型的複雜類型數據(例如符號數據、成分數據、函式數據等)的分析方法的工作目標...
《高維數據統計分析中的若干前沿課題》是依託中國科學技術大學,由吳耀華擔任項目負責人的面上項目。中文摘要 本項目主要致力於處理高維數據的統計方法和理論的研究,它們包括變數選擇,建模,統計推斷和計算.在這些問題中,數據的維數和數據量均很大,現在處理一般數據的統計方法均可能會遇到一些諸如存在系統偏差,漸近分布不同...
因子分析可在許多變數中找出隱藏的具有代表性的因子。將相同本質的變數歸入一個因子,可減少變數的數目,還可檢驗變數間關係的假設。簡介 因子分析是簡化、分析高維數據的一種統計方法。假定p維隨機向量 滿足 是q維隨機變數, ,滿足 ,它的分量 稱為公共因子,對X的每個分量都起作用。 是p維不可觀測的隨機...
發展塊變數回歸 與典型相關分析和相結合的統計學習方法; 研究用幾何拓撲方法來界定出模型預測域或適用區域,使得能把握模型對新樣本預測值的可靠性。 本項目將完成化學計量學的高維數據統計學習的系列方法,為化學工作者提供有效的數據建模方法,促進統計學習的理論和方法在定量結構與活性關係研究中的套用。
《高維數據的圖模型學習與統計推斷》是依託中國人民大學,由尹建鑫擔任項目負責人的青年科學基金項目。項目摘要 研究在高維數據情形下,圖模型的結構學習及相關統計推斷問題。在高維情形下,當均值受到另一組高維協變數影響時,我們用似然函式加懲罰的方法來估計無向圖的結構。用懲罰似然方法研究array-型數據的無向圖...
隨著社會經濟活動形態的日趨複雜和規模的不斷增長,投資決策等經濟管理領域的各類數據呈現出規模的海量性、表示的高維性、結構的複雜性、時空動態性等特點。項目組面向投資決策等國民經濟與社會發展中的現實決策分析問題,以粒度計算為主要理論分析框架,以信息熵為不確定性度量的主要工具,圍繞高維複雜數據的建模與高效...
《生物特徵識別中高維數據的統計降維及算法研究》是王順芳為項目負責人,雲南大學為依託單位的地區科學基金項目。項目摘要 在生物特徵識別中,生物數據的維數往往非常之高,例如龐大的基因表達數據和人臉圖像數據,這類數據的統計分析和降維是生物特徵識別的關鍵技術,也是當前高維數據研究的國際前沿課題,現有降維方法的一個...
5.4數據成分特徵分析 5.4.1主成分分析方法 5.4.2投影尋蹤方法 5.4.3流形學習方法 5.5動態數據特徵分析 5.5.1平穩動態數據特徵分析 5.5.2一般動態數據運動成分分析 5.6數據圖形化方法 5.6.1一維數據圖形化 5.6.2二維數據圖形化 5.6.3三維數據圖形化 5.6.4高維數據圖形化 第6章統計學習方法 6.1...
複雜金融數據之間時變性相依關係建模,高維和高頻金融數據的市場微觀結構建模;複雜金融數據的動態金融風險測度與金融市場質量測度;構建金融發展指數,研究複雜環境下金融結構關係的時變特徵;識別出多維金融資產定價機制與風險形成機制;拓展出具有時變特徵的能反映金融市場間關係的資產收益與風險分析模型。
這些數據的維數已經達到成千上萬,背景知識相當複雜,很難從整體上表示各個變數間錯綜複雜的關係。目前,分析這些高維數據的最有效工具之一是圖模型。它可清晰地表示問題的背景知識及變數間的結構關係,是高維數據統計建模的非常自然的方式。然而,由於圖模型中涉及的變數太多,傳統的參數估計和模型選擇方法,要么計算複雜...
隨著當今以基因晶片(microarray)為代表的高通量生物信息技術的飛速發展,傳統的統計科學面對著高維數據環境下理論和方法的挑戰。本項研究的目的就是為了解決在高維數據情形下的一些基本的統計檢驗問題,主要包括(1)兩組和多組總體間的差異分析,(2)縱向時序(time-course)分析,(3)一些檢驗統計量在高維數據下的...
半參數回歸模型是統計學中重要的模型之一,它在工程技術、計量經濟學和生物醫學等領域有廣泛的套用.關於該模型統計推斷理論和方法的研究是國際統計學領域研究的前沿課題和重要課題.在實際生活中常常會遇到各種高維數據,對高維數據的統計分析與建模是統計學研究的難題.半參數部分線性模型是一種降維模型;它既含有參數分量...
本項目以複雜疾病基因定位研究中期待解決的問題為驅動,以高維罕見變異遺傳數據的統計分析為目的,致力於構建新的統計模型與算法,並把其套用到實際數據分析中。我們具體研究了三部分內容:(1)不同類型疾病變數與高維遺傳位點間關聯分析的相依多重檢驗方法;(2)罕見變異位點關聯分析的統計建模及在高維數據分析中的...
含多個因變數的線性回歸模型是統計學中的經典模型之一,其套用廣泛存在於各個學科中。目前國內外對高維數據情形下的該模型的研究比較欠缺。本項目研究該模型在自變數和因變數維數都遠大於樣本量的情形下的統計推斷問題。在誤差項服從多元常態分配的假設下,我們考慮以下三個問題:一是判斷誤差項的精度矩陣中各元素是否...
《質量管理中高維數據的統計過程控制研究》是依託上海交通大學,由蔣煒擔任項目負責人的面上項目。項目摘要 近年來,隨著現代感測器技術的日益普及和數據採集系統的完善,高維統計過程控制作為現代管理技術正成為我國提高改進產品與服務質量的強有力保證。但是,小批量和差異化生產對高維統計過程控制系統提出了新的挑戰。本...
除此之外,我們還研究了高維數據分析領域裡的其它重要相關議題,比如懲罰充分降維方法、穩健型降維方法以及基於充分降維方法的統計建模問題。在項目資助下,我們在頂級統計學期刊Biometrika, Journal of the American Statistical Association等期刊上發表了數篇高質量學術論文,並多次參與國內外相關學術會議匯報項目研究成果。
《稀疏方差分析與稀疏高維貝葉斯網路學習》是依託北京大學,由賈金柱擔任項目負責人的青年科學基金項目。項目摘要 本項目針對當今普遍的高維數據進行建模和統計分析,尋找合適的統計模型、方法和合適的算法,並對這些方法的統計特性進行理論分析。我們的統計模型是非線性的,並且考慮變數之間的互動作用。通過這種非線性的具有...