中位數

中位數

中位數(又稱中值,英語:Median),統計學中的專有名詞,代表一個樣本、種群或機率分布中的一個數值,其可將數值集合劃分為相等的上下兩部分。

對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的一個作為中位數。如果觀察值有偶數個,通常取最中間的兩個數值的平均數作為中位數。

基本介紹

  • 中文名:中位數
  • 外文名:Median 
  • 別稱:中值
  • 歸屬學科:數學
  • 基本釋義:一組有序數據中居於中間位置的數
  • 領域:統計學;數據挖掘
定義,特點,計算示例,例1,例2,Matlab函式,區別聯繫,

定義

中位數,又稱中點數,中值。中位數是按順序排列的一組數據中居於中間位置的數,即在這組數據中,有一半的數據比他大,有一半的數據比他小,這裡用
來表示中位數。(注意:中位數和眾數不同,眾數指最多的數,眾數有時不止一個,而中位數只能有一個。)
有一組數據:
將它按從小到大的順序排序為:
則當N為奇數時,
;當N為偶數時,
一個數集中最多有一半的數值小於中位數,也最多有一半的數值大於中位數。如果大於和小於中位數的數值個數均少於一半,那么數集中必有若干值等同於中位數。
設連續隨機變數X的分布函式
,那么滿足條件
的數稱為X或分布F的中位數。

特點

1)中位數是以它在所有標誌值中所處的位置確定的全體單位標誌值的代表值,不受分布數列的極大或極小值影響,從而在一定程度上提高了中位數對分布數列的代表性。
2)有些離散型變數的單項式數列,當次數分布偏態時,中位數的代表性會受到影響。
3)趨於一組有序數據的中間位置

計算示例

對於一組有限個數的數據來說,它們的中位數是這樣的一種數:這群數據里的一半的數據比它大,而另外一半數據比它小。 計算有限個數的數據的中位數的方法是:把所有的同類數據按照大小的順序排列。如果數據的個數是奇數,則中間那個數據就是這群數據的中位數;如果數據的個數是偶數,則中間那2個數據的算術平均值就是這群數據的中位數。
中位數:也就是選取中間的數,是一種衡量集中趨勢的方法。

例1

找出這組數據:23、29、20、32、23、21、33、25 的中位數。
解:
首先將該組數據進行排列(這裡按從小到大的順序),得到:
20、21、23、23、25、29、32、33
因為該組數據一共由8個數據組成,即n為偶數,故按中位數的計算方法,得到中位數
,即第四個數和第五個數的平均數。

例2

找出這組數據:10、20、 20、 20、 30的中位數。
解:
首先將該組數據進行排列(這裡按從小到大的順序),得到:
10、 20、 20、 20、 30
因為該組數據一共由5個數據組成,即n為奇數,故按中位數的計算方法,得到中位數為20,即第3個數。

Matlab函式

在Matlab中,median()函式是求取一組數據的中位數的內置函式,使用規則如下:
M = median(A)
M = median(A,dim)
M = median(___,nanflag)
示例:
1)A = [0 1 1; 2 3 2; 1 3 2; 4 2 2]
M = median(A)
得到結果:M = [ 1.5000 2.5000 2.0000]
2)A = [0 1 1; 2 3 2]
M = median(A,2)
得到結果:

區別聯繫

1)平均數是通過計算得到的,因此它會因每一個數據的變化而變化。
2)中位數是通過排序得到的,它不受最大、最小兩個極端數值的影響。部分數據的變動對中位數沒有影響,當一組數據中的個別數據變動較大時,常用它來描述這組數據的集中趨勢。
3)眾數也是數據的一種代表數,反映了一組數據的集中程度.日常生活中諸如“最佳”、“最受歡迎”、“最滿意”等,都與眾數有關係,它反映了一種最普遍的傾向。
優缺點:
平均數:需要全組所有數據來計算;易受數據中極端數值的影響。中位數:僅需把數據按順序排列後即可確定;不易受數據中極端數值的影響。眾數:通過計數得到;不易受數據中極端數值的影響。

相關詞條

熱門詞條

聯絡我們