描述性统计学公式.docx
《描述性统计学公式.docx》由会员分享,可在线阅读,更多相关《描述性统计学公式.docx(29页珍藏版)》请在冰点文库上搜索。
描述性统计学公式
统计学公式汇总表
一、组限和组中值
1当两组间的相邻组限重合时:
组距=本组上限-本组下限组中值=(上限+下限)/2
或=下限+组距/2
或=上限-组距/2
2当两组间的相邻组限不重合时:
组距=下组下限-本组下限或=本组上限-上组上限组中值=(本组下限+下组下限)/2或=本组下限+组距/2或=下组下限-组距/2
3组距式分组中的“开口”情况:
组中值=上限—邻组组距/2
或=下限+邻组组距/2
-、相对指标的种类和计算方法
(一)计划完成相对数
1计划完成相对数的基本计算公式
2计划完成相对数的派生公式:
(1)对于产量、产值增长百分数:
(3)计划执行进度相对数的计算方法:
本期计划数
计划执行进度=计划期内某月止累计完成数*100%
例:
某公司2005年计划完成商品销售额1500万元,1—9月累计实际完成1125万元。
则:
(二)结构相对数
市名
人口数(万人)
国内生产总值(亿元)
人均国内生产总值(元从)
甲
725
280
3862
乙
340
192
5647
比较相对数
(以乙市为100)
213.24
145.83
68.39
例:
2005年某省两个市有关资料如表所示。
例:
某地区国内生产总值
动态相对数
2004年为2097.77亿元,2005年为2383.07亿元。
则:
2383.07
=*100%=113.6%
2097.77
(三)比例相对数
(四)比较相对数
、、,甲地区(单位)某指标数值比较相对数=乙地区(单位)同一指标数值*100%
(五)动态相对数
动态相对数=报告期数值丿相」数基期数值
(六)强度相对数
强度相对数
=某一指标数值
另一有联系的指标数值
例:
某地区2005年零售商业网点为50000个,年平均人口为800万人,则:
零售商业网密度=50000个=62.5(个/万人)
800万人
三、平均指标
(一)算数平均数
1简单算数平均数:
-X1X2
x=—
n
32,则这10个工人日平均加工零件数为:
2加权算术平均数:
①根据单项数列计算加权算术平均数:
n
Xifi
i1
零件数(件)Xi
工人数(人)fi
产量*工人数Xifi
30
20
600
32
50
1600
34
76
2584
35
40
1400
36
14
504
合计
200
6688
nfi
i1
例:
某车间有200名职工,他们每月加工的零件数如表所示:
职工平均加工零件数=30*2032*5034*7635*4036*14=33.44(件)
2050764014
②根据组距数列计算加权算术平均数
Xifi
x=
=—(Xi为组中值)
fi
i1
例:
某食品厂上月有员工300人,其糖果产量资料如表所示:
产量(千克)
员工人数(人)fi
组中值Xi
总产量(千克)Xifi
400以下
22
350
7700
400~500
50
450
22500
500~600
66
550
36300
600~700
76
650
49400
700~800
56
750
42000
800以上
30
850
25500
合计
300
一
183400
n
_Xifi
1十+
X=n=611.33(千克)
fi
i1
(二)调和平均数
1简单调和平均数:
H=—(H代表调和平均数,Xi代表各单位标志值,n代表标志值的项数)n1
i1xi
100千米,返回时逆水行舟,
例:
轮船从甲地开往乙地,去时顺水行舟,船速为每小时船速为每小时80千米,求轮船的平均时速。
H=1=88.89(千米/时)
11
10080
2
2加权调和平均数:
H=
mi
i1
mi
i1Xi
例:
红星制造厂本月购进甲种原材料三批,每批采购价格和采购金额如表所示,求本月购
进甲种原材料的平均价格。
价格(元/千克)Xi
采购金额(元)
mi
采购量(千克)
mi
Xi
第一批
50
25000
500
第二批
55
44000
800
第三批
60
18000
300
合计
一
87000
1600
n
mi
ii87000,
原材料的平均价格:
H=——==54.38(元/千克)
nmi1600
i1Xi
(三)几何平均数
1简单几何平均数:
G=VX1*X2*X3**Xn二Xi(G代表几何平均数,Xi代表各单位标志
值,n代表标志值的项数,n连乘符号)
例:
某地区上个五年期间,经济的发展速度如表所示:
时间
第一年
第二年
第三年
第四年
第五年
发展速度(%)
104.1
107.7
110.5
114.0
118.0
则平均发展速度G=nXi=51.041*1.077*1.105*1.14*1.18=1.1075
2加权几何平均数:
n一n
fi
G=iVx1f1*X2f2*X3f3*
*Xnfn:
fi
_i1fi
-Xi
利用对数计算,则计算公式为:
f1lgX1f2lgX2lgG=n
fnlgXn
n
filgXi
i1
n
i1i1
例:
某地区20年来的经济发展速度如表所示,要求计算20年中经济平均发展速度。
发展速度(%)Xi
年数(次数)fi
lgxi
filgxi
102
1
2.0086
2.0086
105
5
2.0212
10.106
107
10
2.0294
20.2940
110
4
2.0414
8.1656
合计
20
一
40.5742
fIgx
i1
nfi
i1
G=106.83%
四、众数和中位数
(一)众数:
1
下限公式:
M0=L+*i
12
2
上限公式:
M0=U-*i
12
公式中:
L代表众数组的下限值;
U代表众数组的上限值;
△1代表众数组次数与前一组次数之差;
△2代表众数组次数与后一组次数之差;
i代表众数组的组距。
例:
现检测某厂生产的一批电子产品的耐用时间,的资料如表所示。
耐用时间(小时)
产品个数(个)
600以下
84
600~800
161
800~1000
244
1000~1200
157
1200~1400
36
1400以上
18
合计
700
易知众数落在第二组,则:
L=800,1=244—161=83,2=244—157=87,i=200
人胆-183
众数M0=L+*i=800+*200=897.65(小时)
128387
(二)中位数
1由未分组资料确定中位数:
n1、一
Om=(n代表单位标志值的项数)
2
例:
某生产小组7人日产量(件),由低到高排列为:
9,10,12,13,14,15,16,求中位数。
n171
中位数所在位置Om===4
22
2由单项数列确定中位数:
Om=
例:
某车间56个工人的日产量资料如表所示,求车间工人日产量的中位数。
日产量(件)
工人数(人)
累计次数
10
8
8
15
12
20
18
20
40
20
10
50
22
6
56
合计
56
一
n
fi
i156
Om=口==28,对应在第三组。
22
所以Me=18
3由组距数列确定中位数
中位数所在位置
fi
i1
n
i1Sm1
下限公式:
Me=L+—2*i
fm
n
上限公式:
口Sm1
2
Me=U—*i
fm
公式中:
L为中位数所在组的下限值;U为中位数所在组的上限值;
fm为中位数所在组的次数;
Sm-1为中位数所在组前面各组的累计次数;
Sm+1为中位数所在组后面各组的累计次数;i代表中位数所在组的组距。
耐用时间(小时)
产品个数(个)
累计次数
以下累计
以上累计
600以下
84
84
700
600~800
161
245
616
800~1000
244
489
455
1000~1200
157
646
211
1200~1400
36
682
54
1400以上
18
700
18
合计
700
一
一
说明中位数在第三组,即在800-1000小时之间。
五、几种平均数的关系
1算数平均数、众数和中位数的关系:
当X=Me=M0时,分布曲线为正态分布;
当x>Me>M0时,分布曲线右偏;
当X2算数平均数、调和平均数和几何平均数的关系:
H六、变异度指标
(一)变异度指标的计算
1全距:
R=Xmax-Xmin
例:
某车间5个工人日产量分别为5,15,20,30,50,求工人产量全距。
R=50—5=45(件)
2四分位差:
Q°=Xmin;Q4=Xmax;Q2=Me
四分位差的计算公式为:
Q=Q3一Q1
(n1)
公式中:
Q3为第三个四分位数,Q3的位置=Y
4
n1
Q1为第一个四分位数,Q1的位置=——
4
例:
某车间有12个工人,其日产量按数量由小到大依次排列如下:
10,20,22,24,25,26,27,28,30,32,34,35,求其四分位差。
24—22
=22.5(件)
4
Qi的位置=口=^=3.25,则Qi=22+
44
所以Q=Q3—Qi=31.2—22.5=9(件)
3平均差
1
简单平均差:
n
X
丄=24(件)
n
2
加权平均差:
i1
例:
某车间100个工人的日产量资料如表所示:
日产量(件)
工人数(人)fi
组中值Xi
Xifi
|Xi—X|
|Xi—X|fi
10以下
10
5
50
18.8
188
10~20
24
15
360
8.8
211
20~30
40
25
1000
1.2
48
30~40
20
35
700
11.2
224
40以上
6
45
270
21.2
127.2
合计
100
一
2380
一
798.4
4标准差和方差
①简单平均法
n_
(Xix)2
2i1
=6.8=2.61(件)
②加权平均法:
n_
(XX)2fi
2=jlJ
n
fi
i1
=13600=116.62(千克)
3交替标志的标准差:
例:
某车间生产300件产品其中合格品为270件,不合格品30件试计算这批产品的平均合格率及标准差。
合格率:
P=270=90%
300
p=P(1—P)=0.9(1—0.9)=30%
4总方差、组间方差和平均组内方差
5
总方差:
组间方差:
表总体平均数,ni表示第i组的总体单位数,n表示总体单位数)平均组内方差:
(XiXi)2
2i1
i=
n
2
ini
2
公式中:
i代表第i组的组内方差,
体单位数,n表示总体单位数例:
某班组9个工人,日产量分别为
2代表各组组内方差的平均数,,ni表示第i组的总
2,4,4,6,7,8,9,11,12,根据资料计算总平均数
Xi63
-=63=7(件)i9
(xx)
i1
2
90
—=—=10(件)
9
2
将上述资料整理成组距数列并计算组间方差,计算过程如表所示:
日产量(件)Xi
工人数(人)fi
组平均数(件)X;
(Xi—X)2fi
2~5
3
3.33
40.41
6~9
4
7.50
1.00
10~12
2
11.5
40.5
合计
9
一
81.91
n__
(xix)2fi
i1
n
fi
i1
81.91
9
=9.1
根据资料计算各组内方差
2
i以及平均组内方差i2,计算过程见下列各表:
第一组方差计算表
日产量(件)Xi
(Xi—X1)2X1=3.33
2
1.77
4
0.45
计算组内平均数
5变异系数:
4
0.45
合计
2.67
Va=—*100%
例:
某农科所对其培育的甲、
得平均收获率资料和资料和
收获率标准差,如表所示:
甲品种
乙品种
平均公顷产量(千克)
12000
14250
标准差(千克)
570
630
X
乙两种农作物良种进行播种试验,
n
2
ini
i1
n
0.89*31.25*40.25*2
9
8.17
9
=0.9
日产量(件)
工人数fi
组中值Xi
Xifi
(习—X)2fi
累计次数
50以下
11
45
495
9900
11
50~60
13
55
715
5200
24
60~70
70
65
4550
7000
94
70~80
120
75
9000
0
214
80~90
50
85
4250
5000
264
90~100
30
95
2850
12000
294
甲
570
标准差系数:
V甲=
*100%=
*100%=
=4.75%
—
12000
X甲
乙
630
V乙=
*100%=
*100%:
=4.42%
—
14250
X乙
(二)偏度与峰度(不需要背公式,只需要理解公式的意义和作用)
1偏度的测量(下面的计算都不需要掌握,只要能看懂即可。
)
偏度=算数平均数一众数=X—M0
xM0
偏态系数:
SKp=
例:
甲车间300工人日产量资料如表所示:
100~110
5
105
525
4500
299
110以上
1
115
115
1600
300
合计
300
一
22500
45200
一
Xifix=i1
2250O=75(件)
300
=12.27(件)
n
2动差法
n
Xifi_
一阶原点动差M1=——=X
fi
i1
2rXifi
M3=
i1
n
fi
三阶原点动差
n
Xi3fi
i1
n
4rXifi
M4=
i1
n
四阶原点动差
动差法偏态系数:
m3
m3
a=3
或3
-m2
K阶原点动差
xkfi
fi
i1
(Xi—X)2fi
n
fi
1
n
fi
i1
当a=0时,表明分布数列是对称分布。
当a>0时,表明分布数列是正向偏态(右偏)当a<0时,表明分布数列是负向偏态(左偏)例:
日产量(件)
工人数fi
组中值Xi
Xi—X
(Xi—X)fi
(Xi—X)4fi
50以下
11
45
-30
-297000
8910000
50~60
13
55
-20
-104000
2080000
60~70
70
65
-10
-70000
700000
70~80
120
75
0
0
0
80~90
50
85
10
50000
500000
90~100
30
95
20
240000
4800000
100~110
5
105
30
135000
4050000
110以上
1
115
40
64000
2560000
合计
300
一
一
18000
23600000
3=12.273=1847.28
所以a:
-3=0.032
3峰度
峰度得测定是以四阶中心动差(m4)为基础,计算相对数指标,计算公式为:
m4m4&人、
3=4或=2(理解含义)
m2
下面的内容是重点:
3=3时,次数分布曲线为标准正态分布曲线;
3>3时,次数分布曲线为尖顶峰曲线,说明总体次数分布集中趋势明显,标志值变异程度
小;
3<3时,次数分布曲线为平顶峰曲线,说明总体各单位标志值集中趋势不明显,标志值变异程度大。
23600000
=78666.67
300
fi
i1
日产量(件)
工人数fi
组中值Xi
xi—X
(Xi—X)3fi
(Xi—X)4fi
50以下
11
45
-30
-297000
8910000
50~60
13
55
-20
-104000
2080000
60~70
70
65
-10
-70000
700000
70~80
120
75
0
0
0
80~90
50
85
10
50000
500000
90~100
30
95
20
240000
4800000
100~110
5
105
30
135000
4050000
110以上
1
115
40
64000
2560000
合计
300
一
一
18000
23600000
例:
如下表资料所示,测定该车间工人日产量分布数列的峰度系数。
(峰度的计算不作要求)
n_
(X—X)°fi
i1m°=n
44
=12.27=22666.18
3=m°=3.47>3
计算结果表明,工人日产量的分布曲线呈现尖顶峰的分布趋势,说明工人日产量间的差异程度较小,平均数x=75件的代表性较强。