莖葉圖(Stem-and-Leaf display)又稱“枝葉圖”,由統(tǒng)計學(xué)家約翰托奇( Arthur Bowley)設(shè)計,它的思路是將數(shù)組中的數(shù)按位數(shù)進行比較,將數(shù)的大小基本不變或變化不大的位作為一個主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個主干后面的幾個數(shù),每個數(shù)具體是多少。
莖葉圖是一個與直方圖相類似的特殊工具,但又與直方圖不同,莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息。將莖葉圖莖和葉逆時針方向旋轉(zhuǎn)90度,實際上就是一個直方圖,可以從中統(tǒng)計出次數(shù),計算出各數(shù)據(jù)段的頻率或百分比。從而可以看出分布是否與正態(tài)分布或單峰偏態(tài)分布逼近。
R語言中使用stem函數(shù)繪制莖葉圖。stem函數(shù)的語法格式如下:
stem(x, scale = 1, width = 80, atom = 1e-08)
下面使用例子來說明stem函數(shù)的具體使用方法:
某人對自己上班時間的開車速度進行了統(tǒng)計,統(tǒng)計12次的數(shù)據(jù)如下(km/h):
30,33,18,27,32,40,26,28,21,28,35,20
參數(shù)x是數(shù)值向量,用于繪制莖葉圖的數(shù)據(jù)。
v<-c(30,33,18,27,32,40,26,28,21,28,35,20)
stem(v)
繪制結(jié)果如下圖所示:
圖中位于“|”右邊的數(shù)字是1位數(shù)字構(gòu)成的,繪制的莖葉圖默認0-4一組,5-9一組。則可以看出,位于[10,20)區(qū)間的有1個:18;位于[20,30)區(qū)間的有6個;位于[30,40)區(qū)間的有4個:30,32,33,35;位于[40,50)區(qū)間的有1個:40.
stem函數(shù)中的scale參數(shù)控制莖葉圖的長度,默認為1。
v<-c(30,33,18,27,32,40,26,28,21,28,35,20)
stem(v,scale=0.8)
sacle設(shè)置的越大,分莖越多,精度越高,如果你的scale較小,他甚至?xí)詣訋湍愕臄?shù)據(jù)做四舍五入(這樣會降低精度)
控制莖葉圖中葉子的寬度,如果為0,則只輸出該莖統(tǒng)計的數(shù)字個數(shù)。如果為10以內(nèi)的數(shù),則表示超過指定寬度的統(tǒng)計數(shù)量個數(shù),下面的例子可以理解為,統(tǒng)計頻數(shù)比0多的數(shù),多幾個就加幾。
這樣,我們很清楚的知道,10~20之間有1個,20~25之間有2個,25~30之間有4個......
當(dāng)width設(shè)置的足夠大,就可以將所有的數(shù)字顯示全了,默認為100.
v<-c(30,33,18,27,32,40,26,28,21,28,35,20)
stem(v,scale=1,width=90)
新聞熱點
疑難解答