pca技術

主成分分析技術,又稱主分量分析。主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。

基本介紹

  • 中文名:pca技術
  • 外文名:principal components analysis
  • 中文全稱:主成分分析技術
  • 中文別稱:主分量分析、主分量分析
概述,變換的步驟,

概述

PCA(principal components analysis)即主成分分析技術,又稱主分量分析。主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。
在統計學中,主成分分析PCA是一種簡化數據集的技術。它是一個線性變換。這個變換把數據變換到一個新的坐標系統中,使得任何數據投影的第一大方差在第一個坐標(稱為第一主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。主成分分析經常用於減少數據集的維數,同時保持數據集的對方差貢獻最大的特徵。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數據的最重要方面。但是,這也不是一定的,要視具體套用而定。

變換的步驟

(1) 第一步計算矩陣 X 的樣本的協方差矩陣 S(此為不標準PCA,標準PCA計算相關係數矩陣C) :
(2) 第二步計算協方差矩陣S(或C)的特徵向量 e1,e2,…,eN和特徵值 , t = 1,2,…,N ;
(3)第三步投影數據到特徵向量張成的空間之中。利用公式
,其中BV值是原樣本中對應維度的值。
PCA 的目標是尋找 r ( r<n )個新變數,使它們反映事物的主要特徵,壓縮原有數據矩陣的規模,將特徵向量的維數降低,挑選出最少的維數來概括最重要特徵。每個新變數是原有變數的線性組合,體現原有變數的綜合效果,具有一定的實際含義。這 r 個新變數稱為“主成分”,它們可以在很大程度上反映原來 n 個變數的影響,並且這些新變數是互不相關的,也是正交的。通過主成分分析,壓縮數據空間,將多元數據的特徵在低維空間裡直觀地表示出來。

相關詞條

熱門詞條

聯絡我們