四分位數

四分位數

四分位數(Quartile)也稱四分位點,是指在統計學中把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值。多套用於統計學中的箱線圖繪製。它是一組數據排序後處於25%和75%位置上的值。四分位數是通過3個點將全部數據等分為4部分,其中每部分包含25%的數據。很顯然,中間的四分位數就是中位數,因此通常所說的四分位數是指處在25%位置上的數值(稱為下四分位數)和處在75%位置上的數值(稱為上四分位數)。與中位數的計算方法類似,根據未分組數據計算四分位數時,首先對數據進行排序,然後確定四分位數所在的位置,該位置上的數值就是四分位數。與中位數不同的是,四分位數位置的確定方法有幾種,每種方法得到的結果會有一定差異,但差異不會很大。

基本介紹

  • 中文名:四分位數
  • 外文名:quartile
  • 屬性統計學中將排列的數字分為四等分
  • 套用:統計學中的箱線圖繪製
  • 相關算法:將n個數進行排列
  • 示例:必須先確定四分位數位置
概念,示例,套用,相關算法,

概念

分位數是將總體的全部數據按大小順序排列後,處於各等分位置的變數值。如果將全部數據分成相等的兩部分,它就是中位數;如果分成四等分,就是四分位數;八等分就是八分位數等。四分位數也稱為四分位點,它是將全部數據分成相等的四部分,其中每部分包括25%的數據,處在各分位點的數值就是四分位數。四分位數有三個,第一個四分位數就是通常所說的四分位數,稱為下四分位數,第二個四分位數就是中位數,第三個四分位數稱為上四分位數,分別用Q1、Q2、Q3表示。
第一四分位數 (Q1),又稱“較小四分位數”,等於該樣本中所有數值由小到大排列後第25%的數字。
第二四分位數 (Q2),又稱“中位數”,等於該樣本中所有數值由小到大排列後第50%的數字。
第三四分位數 (Q3),又稱“較大四分位數”,等於該樣本中所有數值由小到大排列後第75%的數字。
第三四分位數與第一四分位數的差距又稱四分位距(InterQuartile Range,IQR)。

示例

首先確定四分位數的位置:
Q1的位置= (n+1) × 0.25
Q2的位置= (n+1) × 0.5
Q3的位置= (n+1) × 0.75
n表示項數
對於四分位數的確定,有不同的方法,另外一種方法基於N-1 基礎。即
Q1的位置=1+(n-1)x 0.25
Q2的位置=1+(n-1)x 0.5
Q3的位置=1+(n-1)x 0.75
Excel 中有兩個四分位數的函式。QUARTILE.EXC 和QUARTILE.INC
QUARTILE.EXC 基於 N+1 的方法,QUARTILE.INC基於N-1的方法。
引證1.minitab軟體自帶“公式與方法”(methods and formulas)內,關於第一四分位數的原文如下:
1st quartile (Q1)
Twenty-five percent of your sample observations are less than or equal to the value of the first quartile. Therefore, the first quartile is also referred to as the 25th percentile. Q1 is calculated as follows:
let
w = (N+1)/4
y = the truncated integer value of w
z = the fraction component of w that was truncated away
Q1 = x(y) + z(x(y+1) - x(y))
Note: when w is an integer, y = w, z = 0, and Q1 = x(y)
關於第三四分位數的原文如下:
3rd quartile (Q3)
Seventy-five percent of your sample observations are less than or equal to the value of the third quartile. Therefore, the third quartile is also referred to as the 75th percentile. Q3 is calculated as follows:
let
w = 3(N+1)/4
y = the truncated integer value of w
z = the fraction component of w that was truncated away
Q3 = x(y) + z(x(y+1) - x(y))
Note: when w is an integer, y = w, z = 0, and Q3 = x(y)
以上引文中,w代表分位數位置,y代表位置的整數部分,z代表位置的分數部分。
2. 論四分位數的計算 (湖南工學院工商管理系 祁德軍 南華大學數理學院 陳明)
四分位數
(原文截圖)
實例1
數據總量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
由小到大排列的結果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
一共11項
Q1 的位置=(11+1) × 0.25=3, Q2 的位置=(11+1)× 0.5=6, Q3的位置=(11+1) × 0.75=9
Q1 = 15,
Q2 = 40,
Q3 = 43
實例2
數據總量: 7, 15, 36, 39, 40, 41
一共6項
數列項為偶數項時,四分位數Q2為該組數列的中數,
(n+1)/4= 7/4 =1.75,Q1在第一與第二個數字之間,
3(n+1)/4= 21/4 =5.25, Q3在第五與第六個數字之間,
Q1 = 0.75*15+0.25*7 = 13,
Q2 = (36+39)/2= 37.5,
Q3 = 0.25*41+0.75*40 = 40.25.
1、將數據從小到大排序,計為數組a(1 to n),n代表數據的長度
2、確定四分位數的位置:b= 1+(n-1) × 0.25= 2.25,b的整數部分計為c b的小數部分計為d
計算Q1:Q1=a(c)+[a(c+1)-a(c)]*d=a(2)+[a(3)-a(2)] *0.25 =15+(36-15)×(2.25-2)=20.25
3、計算如上 Q2與Q3的求法類似,四分位差=Q3-Q1

套用

不論Q1,Q2,Q3的變異量數數值為何,均視為一個分界點,以此將總數分成四個相等部份,可以通過Q1,Q3比較,分析其數據變數的趨勢。
四分位數在統計學中的箱線圖繪製方面套用也很廣泛。所謂箱線圖就是 由一組數據5 個特徵繪製的一個箱子和兩條線段的圖形,這種直觀的箱線圖不僅能反映出一組數據的分布特徵,而且還可以進行多組數據的分析比較。這五個特徵值,即數據的最大值、最小值、中位數和兩個四分位數。即:
簡單箱線圖簡單箱線圖

相關算法

將n個數從小到大排列:
Q2為n個數組成的數列的中數(Median);
當n為奇數時,中數Q2將該數列分為數量相等的兩組數,每組有 (n-1)/2 個數,Q1為第一組 (n-1)/2 個數的中數,Q3為為第二組(n-1)/2個數的中數;
當n為偶數時,中數Q2將該數列分為數量相等的兩組數,每組有n/2數,Q1為第一組 n/2個數的中數,Q3為為第二組 n/2 個數的中數。

相關詞條

熱門詞條

聯絡我們