《高維數據變數間非線性互動作用的研究》是依託太原理工大學,由張灝擔任項目負責人的面上項目。
基本介紹
- 中文名:高維數據變數間非線性互動作用的研究
- 項目類別:面上項目
- 項目負責人:張灝
- 依託單位:太原理工大學
- 負責人職稱:教授
- 批准號:11571009
- 研究期限:2016-01-01 至 2019-12-31
- 申請代碼:A0402
- 支持經費:50(萬元)
《高維數據變數間非線性互動作用的研究》是依託太原理工大學,由張灝擔任項目負責人的面上項目。
《高維數據變數間非線性互動作用的研究》是依託太原理工大學,由張灝擔任項目負責人的面上項目。項目摘要在高維大數據分析中,如何有效的判定並估計變數間非線性互動作用是一個基礎難題。高維數據中變數數目遠遠大於樣本量,因而給變數間...
《稀疏方差分析與稀疏高維貝葉斯網路學習》是依託北京大學,由賈金柱擔任項目負責人的青年科學基金項目。項目摘要 本項目針對當今普遍的高維數據進行建模和統計分析,尋找合適的統計模型、方法和合適的算法,並對這些方法的統計特性進行理論分析。我們的統計模型是非線性的,並且考慮變數之間的互動作用。通過這種非線性的具有...
此外,書中還包含了一個對線性arma模型的簡潔介紹,為了說明如何運用非參數技術來揭示高維數據的局部結構,《非線性時間序列--建模、預報及套用》藉助了很多源於實際問題的具體數據,並注重在這些例子的分析中體現部分的分析技巧和工具,閱讀《非線性時間序列--建模、預報及套用》只需要具備基礎的機率論和統計學知識。《...
目前,分析這些高維數據的最有效工具之一是圖模型。它可清晰地表示問題的背景知識及變數間的結構關係,是高維數據統計建模的非常自然的方式。然而,由於圖模型中涉及的變數太多,傳統的參數估計和模型選擇方法,要么計算複雜度比較高,要么功效比較低,很難適應高維數據的情形。本項目中,我們將利用局部計算和共享計算思想...
課題目的是發展基於QAR數據半參數分析的風險預測與評價方法。研究先對QAR數據預處理來解決高維、異頻、異常、缺失等問題。再進行多元分析,探討QAR數據在時間維度上的變化特徵和相關關係,進而研究不同變數間的互動作用。再發展半參數分析模型,構造並比較模型有偏估計和無偏估計,對風險發生規律進行預測,並基於風險預測的...
向後剔除法與模型的所有預測同時開始,然後在每一步消除最小顯著性的變數。這種建模技術的目的是使用最少的預測變數數來最大化預測能力。這也是處理高維數據集的方法之一。2 5. Ridge Regression嶺回歸 當數據之間存在多重共線性(自變數高度相關)時,就需要使用嶺回歸分析。在存在多重共線性時,儘管最小二乘法(...
高維數據的分析需要偏最小二乘(partial least squares,PLS)等特徵空間的壓縮技術。在計算機算法的開發中,需要充分考慮算法的時間和空間複雜度,使用並行計算、格線計算等技術來拓展算法的可實現性。其他 如基因表達譜分析,代謝網路分析;基因晶片設計和蛋白質組學數據分析等,逐漸成為生物信息學中新興的重要研究領域...
它是指實驗結果只想比較每一自變項之特定類目或類別間的差異及其與其他自變項之特定類目或類別間互動作用效果,而不想依此推論到同一自變項未包含在內的其他類目或類別的實驗設計。固定效應回歸是一種空間面板數據中隨個體變化但不隨時間變化的一類變數方法。固定效應模型有n個不同的截距,其中一個截距對應一個個體...
這意味著即使對於高維數據點或大量數據點,樸素貝葉斯分類器也可以表現良好。支持向量機算法 基本思想可概括如下:首先,要利用一種變換將空間高維化,當然這種變換是非線性的,然後,在新的複雜空間取最優線性分類表面[8]。由此種方式獲得的分類函式在形式上類似於神經網路算法。支持向量機是統計學習領域中一個代表性...
OPTICS(Ordering Points To Identify the Clustering Structure):並不明確產生一個聚類,而是為自動互動的聚類分析計算出一個增強聚類順序。。4 基於格線的方法,首先將對象空間劃分為有限個單元以構成格線結構;然後利用格線結構完成聚類。STING(STatistical INformation Grid) 就是一個利用格線單元保存的統計信息進行基於...
7.3 數據異常值檢測分析261 7.3.1 LOF和COF算法262 7.3.2 帶有異常值的高維數據探索267 7.3.3 基於PCA與SOD的異常值檢測方法270 7.3.4 孤立森林異常值檢測274 7.3.5 支持向量機異常值檢測276 7.4 本章小結279 第8章 決策樹和集成學習280 8.1 模型簡介與數據準備280 8.1....