统计学常用公式Word文件下载.docx
《统计学常用公式Word文件下载.docx》由会员分享,可在线阅读,更多相关《统计学常用公式Word文件下载.docx(22页珍藏版)》请在冰点文库上搜索。
=X
N+1
当N为奇数
(
)
XN+XN+1
当N为偶数
=
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N/2确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
N
fi
i=1
-Sm-1
Me=L+
d
fm
Me表示中位数;
L表示中位数所在组的下限;
Sm-1表示中位数所在组以下各组的累
计次数;
fm表示中位数所在组的次数;
d表示中位数所在组的组距。
3.均值的计算【AVERAGE】
(1)未经分组均值的计算
n
xi
未经分组数据均值的计算公式为:
x1+x2+xni1
x=
(2)分组数据均值计算
k
x=x1f1+x
2f+2
+xkfk=i
xifi
分组数据均值的计算公式为:
f1
f2+
+fk
4.几何平均数【GEOMEAN】
几何平均数是N个变量值乘积的N次方根,计算公式为:
G=nx1x2xn=nxi
i-1
G表示几何平均数;
表示连乘符号。
5.调和平均数【HARMEAN】
调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。
简单调和平均数:
H=1
1=n
+
x1
x2
xni
1xi
m1+m2++mn
mi
加权调和平均数:
i1
H=m1
m2
mn
=nmi
xn
i1xi
H表示调和平均数。
6.极差【Range】
极差也称全距,是一组数据的最大值与最小值之差,即
R=maxi-mxiin
R表示极差;
maxxi和minxi分别表示一组数据的最大值与最小值。
7.平均差【MeanDeviation】
平均差是各标志值与其平均数的绝对离差的算术平均。
xi-x
(1)根据未分组资料的计算公式:
AD=i1
(2)根据分组资料的计算公式:
AD=i1
xi-xfi
AD表示平均差
8.方差【Variance】和标准差【StandardDeviation】
方差是各变量值与其均值离差平方的平均数。
要求掌握方差和标准差的计算方法。
xx
未分组数据方差的计算公式为
:
xif
分组数据方差的计算公式为:
2表示方差。
方差的平方根即为标准差,其相应的计算公式为:
未分组数据:
xif
分组数据:
表示标准差。
9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。
其计算公式为:
V
x
V表示离散系数。
10.偏态【SKEW】
偏态是对分布偏斜方向及程度的测度。
利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。
显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。
3
EXCEL中偏态系数的计算公式为:
n-1n-2i1
s
11.峰值【KURT】
EXCEL中峰值系数的计算公式为:
4
nn1
3n1
n1n2n3i1
n1n3
s表示样本标准差。
公式二
1.均值估计
(1)样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样
误差水平。
样本均值的抽样平均误差计算公式为:
重复抽样方式:
x2nn
不重复抽样方式:
通常情况下,当N很大时,(N-1)几乎等于N,样本均值的抽样平均误差的计算公式也可简化为:
x1
nN
在公式中,是总体标准差。
但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S代替。
(2)大样本均值的极限误差xZ2x
(3)大样本下总体均值的区间估计
总体均值的置信度为
(1)的置信区间:
xz2xxz2x即xz2xz2
nn
(4)总体方差未知,小样本正态总体均值的区间估计总体均值的置信度为
(1)的置信区间:
xt2xxt2x
即
xt
2.比例估计
(1)样本比例的抽样平均误差样本比例的抽样平均误差为:
重复抽样下:
p
p1
上式中,p应为总体比例,实际计算时通常用样本比例
p代替。
不重复抽样下:
p1p
(2)样本比例的抽样极限误差
PZ2p
(3)总体比率的区间估计
总体比例P的置信度为
(1)的置信区间为:
pPppP
即pZ2pppZ2p
3.总体均值检验
(1)单一总体均值检验①正态总体(总体方差已知)或大样本均值检验
检验统计量Z为:
Z
②正态总体(总体方差未知)小样本均值检验
检验统计量t为:
tx0
sn
(2)两个总体的均值检验①两个正态总体均值检验——两个总体方差已知或大样本
Z检验统计量为:
x1x2-
n1
n2
大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。
②两个正态总体均值检验(小样本)——两个总体方差未知但相等
T检验统计量为:
x1x
2-
sp
n11s12
n21s22
其中:
s121
xix1;
s22
xix2
n11i
n21i1
4.总体比例检验
(1)单一总体的比例检验
Z检验统计量:
p0
(2)两个总体比例的检验
检验的统计量为:
p?
?
?
n1p1
n2p2
为当
,p
p1
p2时p1
和p2
的联合估计值。
5.总体方差假设检验
(1)单一正态总体方差的假设检验
检验统计量为:
2n1s2
n2
xix
s2i1为2的估计量。
(2)两个正态总体的方差假设检验
Fs12s22
2i1
;
。
s1
s2
公式三
1.单因素方差分析
设总体共分为k种处理进行观察,第j种处理试验了容量为nj的样本。
(1)计算各项离差平方和
在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。
总离差平方和,用SST(Sumof
SquaresforTotal)代表:
nj
SST
xijx
j
x表示全部样本观测值的总均值。
xij
名师推荐
精心整理
学习必备
误差离差平方和,用SSE(SumofSquaresforError)代表:
SSE
xijxj
nj
xj表示第j种水平的样本均值,
xj
水平项离差平方和。
为了后面叙述方便,可以把单因素方差分析中的因素称为A。
于是水平项离差平方和可以用SSA(SumofSquaresforFactorA)表示。
njk2
SSA的计算公式为:
SSA
1j1
(2)计算平均平方
用离差平方和除以自由度即可得到平均平方和(
MeanSquare)。
对
SST来说,其自由度
为(n-1);
对SSA来说,其自由度为(r-1),这里r表示水平的个数;
对SSE来说,其自由度为(n-r)。
与离差平方和一样,SST、SSA、SSE之间的自由度也存在着如下的关系:
n-1=(r-1)+(n-r)
对于SSA,其平均平方MSA(组间均方差)为:
MSA
r
对于SSE,其平均平方MSE(组内均方差)为:
MSE
(3)检验统计量F
F
2.两因素方差分析
设两个因素A、B分别有k个水平和n个水平,共进行nk次试验。
在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A、B项离差平方和。
总离差平方和,用SST(SumofSquaresforTotal)代表:
SSTxijx
x表示全部样本观察值的总均值,其计算公式为:
1n
nki1
j1
水平项离差平方和可以分别用SSA(SumofSquaresforFactorA)和SSB(SumofSquaresforFactorB)表示。
xj
xij
ni
SSB的计算公式为:
SSB
1k
kj
xijxixjx
用离差平方和除以自由度即可得到平均平方和(MeanSquare)。
对SST来说,其自由度为
(nk-1);
对SSA来说,其自由度为(k-1),这里k表示水平A的个数;
对SSB来说,其自由度为(n-1),这里n表示水平B的个数;
对SSE来说,其自由度为(n-1)(k-1)。
这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方:
MSB
k1
n1
k1n1
F(A)
F(B)
公式四
1.拟合优度的检验统计量:
fe
fi表示类别i的观察频数;
fe表示假设H0为真时,类别i的期望频数;
k表示类别总数。
注意:
当所有种类的期望频数均大于或等于5时,检验统计量服从自由度为(k-1)的2分布。