例:
已知某次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。
现准备录取
10%的考生进行面试,录取分数线大致是多少?
P(X>?
)=0.10,即卩P(XV?
)=1-0.10=0.9,=NORMINV(0.9,55,12)=70.38,
最低分数线应为70分。
3•测验分数、测评等级的正态化:
根据被试样本原始分或等级的简单次数分布表,计算各个不同分数或等级的正态标准分数
(1)计算每个不同分数X(或等级)以下累计次数Fb;
(2)计算每个不同分数X(或等级)中点以下累积比率CP:
CPX=—Fb
N
(3)利用Excel统计函数NORMSINV,计算CP对应的正态Z分数。
(4)根据需要,将正态Z分数转为其他标准分数形式:
T分数、CEEB分数、托福考试分数、离差智商IQ等,
T=10Z50,CEEB=100Z500,TOEFL=70Z500,IQ=15Z100
4.偏态系数(SK)和峰态系数(Kurt)的计算与应用
偏态系数:
Excel统计函数SKEW;峰态系数:
Excel统计函数KURT。
偏态系数SK=0,对称分布;SK>0,正偏态分布;SKV0,负偏态分布。
峰态系数Kurt=0,正态分布的峰态;Kurt>0,次数分布的峰度比正态分布峰度低阔;
KurtV0,次数分布峰度比正态分布峰度高狭。
偏态系数和峰态系数都等于0或接近0时,变量的分布为正态分布。
5.二项分布的定义
二项分布是二项试验验结果的概率分布。
进行n次二项试验,各次试验彼此独立,每次试验时
某事件出现的概率都是p,该事件不出现的概率为q(=1-p),则该事件出现x次的概率分布为:
P(X=x)=b(x,n,p,)=C:
pXqn*。
二项分布的Excel统计函数:
BINOMDIST
6.二项分布函数BINOMDIST的应用
对20道四选一的单项选择题,如果完全凭猜测答题,那么
(1)猜对5道题的概率是多少?
(2)猜对5题以下概率是多少?
(3)猜对6题以上的概率是多少?
n=20,每题猜对的概率为p=0.25
(1)猜对5道题的概率P(X=5)=BINOMDIST(5,20,0.25,0)=0.20233
(2)猜对5题以下的概率P(X<5)=BINOMDIST(5,20,0.25,1)=0.61717
(3)猜对6题以上的概率P(X>6)=1-P(X<5)=1-BINOMDIST(5,20,0.25,1)=0.38283
7.二项分布的形态:
随n、p的变化具有不同的分布形态
(1)当p=q时,二项分布是对称分布。
(2)当p=q,np》5时,接近正态分布。
(3)当p为,npv5或nqv5时,二项分布为偏态分布。
(4)当p为,np》5且nq>5时,二项分布接近正态分布。
&二项分布的平均数和标准差
进行n次二项试验,每次试验时某事件出现的概率都是p,则该事件出现次数的理论平均数(」)、
方差(匚2)和标准差二分别为:
」二np,二2pq,、npq。
如果np>5且nq》5,成功事件出现结果的概率分布接近」=np、二=.npq的正态分布。
进行投掷100枚硬币试验,如果进行无数次试验,正面向上的硬币数目会在0〜100个之间变化。
那么,正面向上次数的理论平均数:
尸np=100X0.5=50,标准差为;「=..npq=_1000.50.5=5。
20道四选一的单项选择题,如果完全凭猜测答题,那么,
猜对题数的平均数为^np=20X1/4=5
猜对题数的理论标准差为;丁二..npq=.201/43/4=1.94。
第七章总体参数估计
1•常用的点估计:
总体均数卩的点估计:
用样本平均数X,Excel统计函数为AVERAGE
总体方差彳的点估计:
用样本标准差,或S2•―—。
n-1
|
总体标准差袖勺点估计:
用样本标准差Sn4,或n。
\n—1
2•总体平均数的区间估计
1•若样本均数的抽样分布为正态分布,
总体均数的0.95置信区间为:
X_Z0.052SEx
—s
=X_1.96
总体均数的0.99置信区间为:
X-Z0.012SEX
_s
=X_2.58
2.若样本均数的抽样分布为df=n-1
的t分布,那么,
总体均数的0.95置信区间为:
S
—t0.05/2SEx-XJjt0.05/2
.n-1
总体均数的0.99置信区间为:
S
X二10.01/2SEx=X=to.01/2
.n-1
自由度df=n-1,t°.°52=?
t°.°52=?
也可查教材453页t值表
可用Excel统计函数TINV计算。
3•总体方差与标准差的区间估计
总体方差c2的0.95置信区间为:
nS2_2
02025八
nS2
<
2
或(n—1)Sn_L
2,^或
0.975
2
0.025
(n-1)S;」
V772,
0.975
总体方差
nS2
:
二2的0.99置信区间为:
nS2或(n—1)S;4
-2,或
0.995
2
—
0.005
自由度df=n-1的2分布右侧概率区间点的计算,也可用也可查教材475页2分布数值表
总体标准差b的置信区间:
取总体方差二2置信区间上、
4•总体积差相关系数的区间估计:
2:
:
:
二
0.005
瞪995
Excel统计函数CHIINV。
下限的正平方根。
(1)
将样本相关系数r转换为费舍
Zr值,转换方法:
Excel统计函数FISHER
(2)
计算Zr的标准误
SEZr:
SEzr
n-3
(3)
计算总体Zp值的
1-a置信区间:
Zr_Z:
.2SEzr
(4)
0.95置信区间为:
0.99置信区间为:
计算总体相关系数
转换方法:
Excel
Zr--Z0.052SEZr
Zr-Z0.012SEZr
=Zr一258
P值的置信区间:
统计函数FISHERINV
将总体Zp值区间上、下限进行费舍逆转换,
5•总体比率(比例)的区间估计
n0_5,n(f_5时,样本比率
总体比率的0.95置信区间为:
0的抽样分布渐近正态分布。
=0_1.960<0
Vn
0-1.96SEp
总体比率的0.99置信区间为:
0-2.58SEp
=0_2.58
第八章假设检验
在Z检验中:
双侧检验临界值:
Zo.05/2=1.96Zo.0!
/2=2.58
单侧检验临界值:
Zo.o5=1.645Zooi=2.326
单侧显著性概率
双侧显著性概率
P:
=1-NORMSDIST(ABS(Z值))
P:
=(1-NORMSDIST(ABS(Z值)))*2
在t检验中:
单侧显著性概率
P:
=TDIST(ABS(t值),
df,1)
双侧显著性概率
P:
=TDIST(ABS(t值),
df,2)
1.单个样本
Z检验
主要用途:
:
分析单个样本均数
x与已知的总体均值g
的有无显著差异
适用条件:
(1)总体呈正态分布,总体方差匚2已知;
(2)总体是正态分布,总体方差匚2虽然未知,但样本容量n_30;
(3)即使总体非正态分布,总体方差二2也未知,样本容量n_30。
2.单个样本t检验
主要用途:
用于分析单个样本均数X与已知的总体均数g的差异,
df二n「1
3.单个样本比率Z检验
主要用途:
根据一个样本的比率
p,分析样本所代表的总体比率
P与已知比率P0有无显著差异。
适用条件:
np0_5,nq0_5
卩-Po
Po(1-P0)
4.两独立样本比率差异Z检验
主要用途:
根据两个独立样本的比率?
1-?
2,推断两总体比率P1、P2有无显著差异
适用条件:
两个样本相互独立,n1p1,n2?
2,n10,匕?
2都》5
01-?
2
I
(n1?
1+n2?
2)(门1嗥+门2电)
n1n2(n1n2)
5.两独立样本方差齐性检验
主要用途:
根据相互独立的两个样本的方差,推断两个总体的方差是否相等或是否有显著差异。
双侧显著性概率
P值:
=FDIST(F值,分子自由度,分母自由度)*2
6.相关样本t检验
主要用途:
(1)根据一组被试前、后两次测评结果,推断两次测验结果的总体均数有无显著差异。
(2)
X1-X2
2
根据实验组和配对对照组测评结果,推断实验组和对照组的总体均数有无显著差异。
适用条件:
两个样本的数据有—对应关系,且有可比性;两总体数据呈正态分布。
t=—^:
S-2S;-2rS1S2
Vn—1
7.
独立样本
Z检验
主要用途:
根据两个独立样本的均数差异
X1
适用条件:
(1)
两总体为正态分布,
总体方差
(2)
两总体非正态分布,
总体方差
(3)
8.
9.
总体c12、
两总体非正态分布,
z二X1
独立样本等方差假设t检验
主要用途:
适用条件:
总体方差
-X2
2
n2
根据两个独立样本的均数差异
(1)两总体为正态分布,总体
-X2,推断两总体均数叫、二2有无显著差异。
2
:
-1
_2
1、
2
■■-1
2
匚2已知,二;已知,
2
二2未知,
不管样本大小
m_30,
m_30,
总体、匚2未知时:
n2_30时
X1—X2
|22
's1.s2.n「n2
s1
(2)两总体非正态分布,总体
22
□、匚2是否相等,需要先做方差齐性检验。
注意:
大多数情况下,两总体方差基本相等。
两总体方差
x1_x2
t22
n1s1n2sf
n1n2-2
11
*()
n1n2
独立样本异方差假设t检验
主要用途:
适用条件:
df
根据两个独立样本的均数差异
(1)
两总体为正态分布,总体
(2)
两总体非正态分布,总体
X1-X2,推断两总体均数
22
□、匚2未知,且
匚1、二2未知,且
叫、丄2有无显著差异?
_2_2
-1—2
_2_2
;_1h一2
,不管样本大小
X1-X2,推断两总体均数
、匚2未知,且-工匚;,不管样本大小二;、二;未知,且二;工;雳,厲—30,山―30时
丄1、丄2有无显著差异?
2
2
2
tX1-刃2
t:
.n1n2
当n^i=n2=n时,df
当心2时,出飞行1)2(s2ny
口-1门2-1
10.积差相关显著性t检验
主要用途:
根据一对变量的样本数据及其积差相关系数适用条件:
两变量为连续性数值变量,且总上正态分布。
n_2
匚孑df=n-2
第十四章抽样原理及方法(参见教材)
r,推断两变量有无显著关系。