簡單介紹
莖葉圖的
思路是將
數組中的數按位數進行比較,將數的大小基本不變或變化不大的位作為一個主幹(莖),將變化大的位的數作為分枝(葉),列在主幹的後面,這樣就可以清楚地看到每個主幹後面的幾個數,每個數具體是多少。
莖葉圖有三列數:左邊的一列數
統計數,它是上(或下)向中心累積的值,中心的數(帶括弧)表示最多數組的個數;中間的一列表示莖,也就是變化不大的位數;右邊的是數組中的變化位,它是按照一定的間隔將數組中的每個變化的數一一列出來,像一條枝上抽出的葉子一樣,所以人們形象地叫它莖葉圖,如圖1所示。
與直方圖的比較
莖葉圖是一個與直方圖相類似的特殊工具,但又與直方圖不同,莖葉圖保留
原始資料的資訊,直方圖則失去原始資料的訊息。將莖葉圖莖和葉逆時針方向旋轉90度,實際上就是一個直方圖,可以從中統計出次數,計算出各數據段的頻率或百分比。從而可以看出分布是否與
常態分配或單峰
偏態分布逼近。
莖葉圖在
質量管理上用途與直方圖差不多,但它通常是作為更細緻的分析階段使用。由於它是用數字組成直方圖,所以在做的時候比直方圖時,通常我們常使用專業的軟體進行繪製。
優缺點
優點
1、用莖葉圖表示數據有兩個優點:
(1)從
統計圖上沒有原始數據信息的損失,所有數據信息都可以從莖葉圖中得到;
(2)莖葉圖中的數據可以隨時記錄,隨時添加,方便記錄與表示。
缺點
莖葉圖只便於表示個位之前相差不大的數據,而且莖葉圖只方便記錄兩組的數據。兩個以上的數據雖然能夠記錄,但是沒有表示兩個記錄那么直觀、清晰。
例子
例1
下面有一堆數據共30個:
89、79、57、46、1、24、71、5、6、9、10、15、16、19、22、31、40、41、52、55、60、61、65、69、70、75、85、91、92、94
畫出的莖葉圖如下:
莖|葉
0 | 1 5 6 9
1 | 0 5 6 9
2 | 2 4
3 | 1
4 | 0 1 6
5 | 2 5 7
6 | 0 1 5 9
7 | 0 1 5 9
8 | 5 9
9 | 1 2 4
比如第二行的數字:
1 | 0 5 6 9,
它們代表數據集中有10、15、16和19四個數字。
可以這樣理解莖+葉=實際的數值,如 1|0 5 6 9 中莖值為1,葉值為 0、5、6和9共四個葉值。
其真實數值計算方式:莖值連線葉值,也就是說當莖值是1,葉值是0時,連線起來就是真實數值10。
例2
現在有一堆30個數據:
41、52、6、19、92、10、40、55、60、75、22、15、31、61、9、70、91、65、69、16、94、85、89、79、57、46、1、24、71、5
畫出的莖葉圖如下:
0 | 1 5 6 9
1 | 0 5 6 9
2 | 2 4
3 | 1
4 | 0 1 6
5 | 2 5 7
6 | 0 1 5 9
7 | 0 1 5 9
8 | 5 9
9 | 1 2 4
比如第二行的數字如下:
1 | 0 5 6 9
則代表數據集中有10、15、16和19四個數字。
注意:一個莖可以有很多葉也可以不出現葉。
找中位數
將所有的數列出,找出中間的數,奇數個為一個,偶數時中間兩個數的
平均數,即為
中位數。
舉個例子,如圖2所示,列出數:2、10、15、20、23、27。中間的數是(15+20)/2=17.5,即17.5為中位數,假如中間加上一個數22,中位數則變成了20。