《一些新方法在高維數據中的套用》是依託中國科學院數學與系統科學研究院,由朱力行擔任項目負責人的面上項目。
基本介紹
- 中文名:一些新方法在高維數據中的套用
- 項目類別:面上項目
- 項目負責人:朱力行
- 依託單位:中國科學院數學與系統科學研究院
- 批准號:19571089
- 申請代碼:A0401
- 研究期限:1996-01-01 至 1998-12-31
- 負責人職稱:研究員
- 支持經費:4(萬元)
《一些新方法在高維數據中的套用》是依託中國科學院數學與系統科學研究院,由朱力行擔任項目負責人的面上項目。
本課題理論成果將為混合有文本信息的高維金融數據建模等複雜數據套用領域提供有效的解決工具。結題摘要 本課題通過對基於高維金融數據的貝葉斯柔性密度建模,對貝葉斯方法在高維柔性密度估計的模型假設、模型估計、模型驗證、模型預測等理論和計算進行研究。從二維離散和連續邊際的 Copula的柔性密度模型出發,研究高維 Copula ...
二是在收集的高維數據具有稀疏性情況下,套用當前流行的SCAD和MCP等大規模數據模型選擇方法,在模型選擇的同時對多變點進行更加快速有效的檢測。三是當高維數據不具有稀疏性情形下,研究具有相依結構的大維隨機矩陣極限譜分布,進而研究由譜分布構成的多元統計量的極限性質,為統計推斷奠定基礎。本項目還將採用上述方法對...
本項目將重點研究:(1)基於稀疏性的回歸模型;(2)高維數據的本徵表達;(3)快速線上學習算法。項目的創新之處在於將新的數學理論與具體的實際問題相結合,並套用於面像識別、生物信息學等領域。本課題的研究將豐富套用數學與機器學習理論,並為實際問題提供新的解決途徑。結題摘要 本課題圍繞稀疏正則化方法及...
非參數經驗貝葉斯適用於具有相同統計結構的高維未知參數的統計推斷問題。但是由於技術的原因,非參數經驗貝葉斯的研究並不充分。Bradley Efron把原因歸結為“缺少有很多相同結構未知參數的套用問題”,並指出“由於現代數據採集技術和計算機計算能力的快速提高,當今的科學潮流有利於增強非參數經驗貝葉斯所起的角色”。 本...
大數據環境下的高維數據流在無線感測網路、移動通信、社交網路以及生物信息等領域有廣泛的套用前景,是當前數據挖掘領域的重要研究方向。由於大數據環境下高維數據流存在維數災難及數據分布不穩定等問題,傳統方法尚難以對如此複雜的數據進行深入的處理和挖掘。本項目研究大數據環境下高維數據流的降維、概念漂移檢測、分類及...
本項目將在高維數據背景下發展模型平均方法,具體地將研究以下幾個問題:(1)線性模型下的模型平均方法;(2)其他模型下的模型平均方法;(3)超高維數據下的模型平均方法;(4)模型平均方法的套用。對於這些問題,我們已經有很好的工作積累。本項目的研究將獲得一批高水平的理論與套用成果,為實際工作者分析、處理...
《高維數據的維數約簡方法及其套用》是2016年科學出版社出版的圖書,作者是王建中。內容簡介 高維數據的維數約簡技術是當今計算機科學、機器學習等領域的熱門研究問題之一,具有廣泛的發展前景。本書在對已有維數約簡方法進行分析和總結的基礎上,從特徵提取和特徵選擇兩個方面提出五種新的維數約簡方法,並以人臉圖像和...
該研究不僅可以完善集成學習的理論基礎,也將為解決自然科學和國民經濟各領域的同類問題提供有效方法。結題摘要 本項目主要研究在高維小樣本情況下,集成學習方法在解決模式分類問題中的相關理論、算法及套用。所取得的主要成果集中在下述幾個方面:集成學習在不平衡數據分類中的套用,基於深度學習的特徵提取與降維,回歸和...
但指紋方向場的傳統高維數據表示方式對特徵分析造成了困難。本項目將結合指紋識別研究經驗和先進的高維數據分析方法,將方向場離散數據轉化為函式表示,然後利用函式特性來研究方向場特徵變化關聯的典型模式及其在現場指紋殘缺方向場重建和真、假指紋形變模型中的套用。本項目立足於生物安全和統計分析的跨學科領域,其順利...
根據搜尋的方向的不同,可以將子空間聚類方法分成兩大類:自頂向下的搜尋策略和自底向上的搜尋策略。子空間聚類是實現高維數據集聚類的有效途徑,它是在高維數據空間中對傳統聚類算法的一種擴展,其思想是將搜尋局部化在相關維中進行。套用 高維數據聚類分析是聚類分析中一個非常活躍的領域,同時它也是一個具有挑戰性...
《高維數據的流形學習分析方法》是2016年武漢大學出版社出版的圖書,作者是李波。內容簡介 流形學習作為一種非線性維數約減方法,可以成功挖掘高維非線性數據中蘊含的幾何結構信息,實現高維數據到低維空間中的映射。本書首先介紹了流形學習方法研究的背景和典型套用領域,然後對於流形及流形學習相關的數學概念進行定義,...
(5)針對各種判別分類的統計降維算法,研究了評價其識別性能的有關參數的估計和檢驗方法。並套用這些估計的參數評價上述所討論的各種降維算法。 項目研究達到預期要求,得到在生物特徵識別中可處理各種複雜高維數據的較系統的新算法,進一步提高了降維算法的穩健性和識別率;在生物統計、統計計算、統計學習等方向正式發表...
最後,在數據和模型的基礎上,編碼先驗約束提高各ELM的性能。本項目以高維小樣本的基因表達譜數據為研究對象,在對其處理中檢驗完善提出的方法。由於編碼了問題中的先驗約束,本課題的研究不但能提高高維小樣本數據處理精度和速度,還大大增強機器學習的透明性。該課題為與機器學習有關的套用基礎研究,它的深入研究必將...
針對該問題,開展基於高維徵兆數據分析的多故障體系空間和實體識別鑑定的研究。將多故障診斷視為一種不確定性因果關聯表現,以徵兆的空間距離、機率、趨勢、分布、對象組相似度等參數作為多故障體系的數量定性指標,利用類比、學習、自組織等技術手段,使用聯合聚類、非線性映射、目標最佳化、子空間映射等方法,將高維徵兆...
隨著計算機和資料庫技術的發展,很多研究領域需要處理的數據維度越來越高,特徵選擇被廣泛套用於剔除高維數據中的無關/冗餘特徵,並提高高維數據分析的準確性。對於高維數據特徵子集空間的搜尋問題,大多數傳統搜尋方法都無法在短時間內給出令人滿意的結果。本項目在國內外首次提出一種新型自生式Memetic特徵選擇框架動態自...
《高維數據的多元分辨法及其在中草藥分析中的套用研究》是依託湖南大學,由梁逸曾擔任項目負責人的面上項目。中文摘要 本研究主要將我們已發展的針對高維聯用儀器的化學計量方法用於解決中草藥的直接定性定量的分析難題,並針對中草藥分析中存在的實際困難,繼續發展一些實用的新解析方法,以形成一整套適合於中草藥中...