基本介紹
- 中文名:pca技術
- 外文名:principal components analysis
- 中文全稱:主成分分析技術
- 中文別稱:主分量分析、主分量分析
概述,變換的步驟,
概述
在統計學中,主成分分析PCA是一種簡化數據集的技術。它是一個線性變換。這個變換把數據變換到一個新的坐標系統中,使得任何數據投影的第一大方差在第一個坐標(稱為第一主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。主成分分析經常用於減少數據集的維數,同時保持數據集的對方差貢獻最大的特徵。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數據的最重要方面。但是,這也不是一定的,要視具體套用而定。
變換的步驟
(2) 第二步計算協方差矩陣S(或C)的特徵向量 e1,e2,…,eN和特徵值 , t = 1,2,…,N ;
(3)第三步投影數據到特徵向量張成的空間之中。利用公式,其中BV值是原樣本中對應維度的值。