国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > R > 正文

統(tǒng)計中集中趨勢的分析及在R語言中的計算

2023-05-01 13:45:41
字體:
供稿:網(wǎng)友

集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏或集中的程度。主要包括平均值、眾數(shù)、中位數(shù)和分位數(shù)。

先普及一下幾個概念:

(1)總體

在數(shù)理統(tǒng)計中,我們把研究對象的全體元素構(gòu)成的集合稱為總體(或母體),而把組成總體的每個元素稱為個體。如果總體包含有限個個體,則稱為有限總體(或具體總體)。如果總體包含無限個個體,則稱為無限總體(或抽象總體)。

(2)樣本

把從總體X中隨機(jī)抽檢(或觀察)n個個體的試驗,稱為隨機(jī)抽樣,簡稱抽樣,n稱為容量。

(3)樣本均值

設(shè)X1, X2, ..., Xn是總體X中的一個樣本,則統(tǒng)計量

樣本均值公式

(4)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的觀測值叫做眾數(shù),用M0表示。眾數(shù)測度數(shù)據(jù)的集中性趨勢,一般在數(shù)據(jù)量較大的情況下,眾數(shù)比較有意義。

(5)中位數(shù)

中位數(shù)簡單講就是數(shù)據(jù)排序位于中間位置的值,記為Me,即統(tǒng)計量

統(tǒng)計學(xué)中求偶數(shù)的公式

 中位數(shù)描述數(shù)據(jù)中心位置,對于對稱分布的數(shù)據(jù),均值接近中位數(shù);偏態(tài)分布式指頻數(shù)分布不對稱,集中位置偏向一側(cè),數(shù)據(jù)的均值則與中位數(shù)不同。它的顯著特點在于不受異常值的影響,具有穩(wěn)健性。

(6)分位數(shù)

統(tǒng)計量

統(tǒng)計量p分位數(shù)

稱為樣本的p分位數(shù)。常用的有五分位數(shù),由次序樣本的前0%,25%, 75%, 100%位置的5個數(shù)構(gòu)成。

下面探討在R語言中,如何實現(xiàn)。

(1)樣本均值

在R中,mean()函數(shù)用于計算樣本的均值,其使用格式為:

mean(x, trim=0, na.rm = FALSE, ...)

其中,參數(shù)x為計算對象,可以是向量、矩陣、數(shù)組或數(shù)據(jù)框;trim用于設(shè)置計算均值前去掉兩端數(shù)據(jù)的百分比,即計算結(jié)尾均值,取值在0~0.5之間;na.rm為邏輯值,指示是否允許有缺失值(NA)的情況,默認(rèn)為FALSE(不允許);...為附加參數(shù),

樣本均值舉例如下:

某班級20名學(xué)生的英語成績?yōu)?8,78,67,69,62,100,73,45,70,60,93,97,84,82,81,73,68,76,77,92。計算其均值

x<-c(88,78,67,69,62,100,73,45,70,60,93,97,84,82,81,73,68,76,77,92)
mean(x)

結(jié)果是76.75

如計算結(jié)尾,則:

mean(x,trim=0.05)

則結(jié)果是:77.22

(2)計算眾數(shù)

在R中,沒有給出直接計算眾數(shù)的函數(shù),自己可以編寫函數(shù),或使用下面的語句獲取眾數(shù)。

tmp<-table(x)  #計算出x中每個值出現(xiàn)的次數(shù)
index<-which.max(tmp)  #找出最多次數(shù)的索引
tmp[index]  #輸出對應(yīng)的數(shù)據(jù)及次數(shù)

本例的結(jié)果形式如下:

73
  2

但此方法只能適用于求一個眾數(shù)的情況。如果想找出具有多個眾數(shù)(即有多個數(shù)據(jù)的頻率相同且為最大者)的情況,可以使用下面的語句:

tmp<-table(x)
tmp.max<-max(tmp)
which(tmp==tmp.max)

若果令向量x的值為:12, 14, 16, 12, 15, 12, 15, 15;則會輸出如下結(jié)果:

12    15
  1      3

(3)計算中位數(shù)

在R中,使用median()函數(shù)計算一組數(shù)據(jù)的中位數(shù)。其形式如下:

median(x, na.rm = FALSE, ...)

各參數(shù)的含義與求均值函數(shù)mean()相同。

接均值的例子:

median(x)

結(jié)果為:76.5

由均值(76.75)和中位數(shù)(76.5)可知,均值稍大于中位數(shù),可以初步判斷,所給樣本數(shù)據(jù)呈右偏分布。

(4)計算分位數(shù)

R中使用quantile()計算分位數(shù),其形式如下:

quantile(x, probs = seq(0, 1, 0.25), na.rm = FALSE, names = TRUE, type = 7, ...)

其中,參數(shù)x為數(shù)據(jù)對象;probs給出相應(yīng)的百分位數(shù);na.rm表示是否允許包含缺失值;names為邏輯值,指示是否為結(jié)果給出命名屬性;type為分為數(shù)的算法,取值1~9,默認(rèn)為7。

接均值的例子計算

quantile(x)
quantile(x,names=FALSE) #去掉各值的名字
fivenum(x)  #使用次函數(shù)可以直接計算出五個數(shù)
summary(x) #使用該函數(shù)可以計算出五數(shù)及均值

結(jié)果形式如下:

R中計算分位數(shù)

從結(jié)果中可以看出:quantile()函數(shù)默認(rèn)可以直接計算出五個數(shù):最小值、25%的四分位數(shù)、中位數(shù)、75%的四分位數(shù)和最大值。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 泽州县| 新巴尔虎左旗| 锡林浩特市| 乌兰县| 台湾省| 安西县| 栾城县| 始兴县| 临邑县| 四会市| 苗栗市| 庄河市| 开化县| 宁武县| 洪泽县| 新野县| 水城县| 太和县| 大方县| 太白县| 德昌县| 莱州市| 澳门| 松阳县| 科技| 紫阳县| 平乐县| 宁河县| 周口市| 宣恩县| 开阳县| 珠海市| 岳普湖县| 当雄县| 米脂县| 红原县| 泰兴市| 隆林| 东阳市| 施甸县| 大兴区|