QQPlot圖

QQPlot圖是用於直觀驗證一組數據是否來自某個分布,或者驗證某兩組數據是否來自同一(族)分布。在教學和軟體中常用的是檢驗數據是否來自於常態分配

基本介紹

  • 中文名:QQPlot圖
  • 作用:驗證數據
  • 學科:屬性
  • 特點:常態分配
屬性結構
(1)若是檢驗一組數據是否來自某個分布,分布函式為F(x),通常圖的縱坐標為排好序的實際數據(次序統計量:x(1)<x(2)<....<x(n)),可以稱之為經驗分位點。橫坐標為這些數據的理論分位點,所謂理論分位點是這樣得到的,先算出各個排好序的數據對應的百分比p(i),即第i個數據x(i)為p(i)分位數,其中p(i)=(i-0.5)/n,這裡p(i)有很多種算法,有的定義為i/(n+1)等等,則x(i)對應的理論分位點為F^(-1)(p(i))=F^(-1)((i-0.5)/n),這也就是橫坐標的值。其中為什麼不把p(i)定義為i/n呢?有解釋說,若這樣定義,則最大的那個數對應的p(n)=1,這樣很多分布函式的F^(-1)=infinity,這樣無法在坐標上表示出來,所以稍作修改。QQ圖的橫縱坐標定義好後,則可在圖上做出散點圖來,然後再在圖上添加一條直線,這條直線就是用於做參考的,看散點是否落在這條線的附近。直線由四分之一分位點和四分之三分位點這兩點確定的,四分之一分位點的坐標中橫坐標為實際數據的四分之一分位點(quantile(data,0.25)),縱坐標為理論分布的四分之一分位點(qF(0.25)),四分之三分位點類似,這兩點就剛好確定了QQ圖中的直線。
(2)若是檢驗兩組數據是否來自同一個分布函式F(x),則直接將兩組數據的各自的理論分位點當作橫縱坐標,然後看是否在一條直線的附近。此種方法對於兩組數據數量不一致的時候,需要用插值法,將數據少的那組數據通過插值的方法補齊。在R中qqplot就在進行這件事情。或者將兩個QQ圖放在一起,將兩組數據用不同的顏色標識,看兩組數據是否離得很近。

相關詞條

熱門詞條

聯絡我們