抽样分布参数估计和假设检验.docx
《抽样分布参数估计和假设检验.docx》由会员分享,可在线阅读,更多相关《抽样分布参数估计和假设检验.docx(38页珍藏版)》请在冰点文库上搜索。
抽样分布参数估计和假设检验
抽样分布
一、抽样分布的理论及定理
(一)抽样分布
抽样分布是统计推断的基础,
它是指从总体中随机抽取容量为n的若干个样本,对每
也称统计量分布或随机变
样本可计算其k统计量,而k个统计量构成的分布即为抽样分布,量函数分布。
(二)中心极限定理
中心极限定理是用极限的方法所求的随机变量分布的一系列定理,个方面。
1•如果总体呈正态分布,则从总体中抽取容量为分布也呈正态分布;无论总体是否服从正态分布,接近正态分布。
2•从总体中抽取容量为n的一切可能样本时,均数()即
其内容主要反映在三
n的一切可能样本时,其样本均数的只要样本容量足够大,样本均数的分布也
所有样本均数的均数(
X)等于总体
3.从总体中抽取容量为n的一切可能样本时,
所有样本均数的标准差(
X)等于总
体标准差除以样本容量的算数平方根,即
X石
中心极限定理在统计学中是相当重要的。
因为许多问题都使用正态曲线的方法。
这个
定理适于无限总体的抽样,同样也适于有限总体的抽样。
中心极限定理不仅给出了样本均数
抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给
出了推断统计中两个重要参数(即样本均数X与样本标准差X)的计算方法。
(三)抽样分布中的几个重要概念
1•随机样本。
统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(randomsampie)。
所谓随机样本是指按照
概率的规律抽取的样本,
2.抽样误差。
从总体中抽取容量为门的k个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不
同,称为抽样误差。
3.
符号SE或X
df或n表示。
标准误。
样本统计量分布的标准差或某统计量在抽样分布上的标准差,表示。
根据中心极限定理其标准差为
S2
dfN1,即有方差
二、常用抽样分布
t分布、F分布、
在心理与教育统计中,常用的抽样分布有正态分布、渐近正态分布、q分布和2分布等等。
(一)正态分布及渐近正态分布当统计量的分布符合正态分布或渐近正态分布时,进行统计推论的理论依据即为正态分
布的理论。
以样本平均数为例,正态分布的应用情形如下。
1.总体呈正态,总体方差则有
2
已知,则样本均数的分布也呈正态。
根据中心极限定理
1样本均数的均数等于总体均数,即
2样本均数的标准差等于总体标准差除以样本容量的平方根,即
Z
③差异检验值为
X_
117
2
已知,样本容量n足够大,样本均数的分布为渐近正
样本均数的均数等于总体均数:
样本均数的标准差等于总体标准差除以样本容量的平方根。
Z-—检验值SEx
(二)t分布
1.t分布的定义
t分布是由小样本统计量形成的概率分布。
2.t分布的特点
1t分布也是对称分布。
即平均数位于曲线的中央,在这一点上有一个单峰,从中央向两侧逐渐下降,尾部无限延长,但不与基线相交。
2t分布曲线的形状易变,曲线不是一条而是一族,其曲线形状随着样本容量的变化而有规律地变动,即随自由度的大小而变化。
3理论上,当n^s时,t分布曲线以标准正态曲线为极限,即呈正态分布。
当n逐渐
减少时,
分布的离散程度逐渐增大,曲线逐渐与标准正态分离;其峰顶逐渐下降,尾部抬高。
如图
7-13所示
4t分布的t值及对应的概率值(P)是根据自由度的大小由理论模型推导出来的,构成t分布临界值,表见附表4。
3.t分布的应用
t分布的标准误为
因为总体标准差未知,只能以样本标准差Sn来代替。
而样本标准差Sn与总体标准差
的差距较大,统计学家发现总体标准差的良好无偏估计量为
Sn1,即
SIxx2
Sn1、
VN1
所以用Sn1代替则有上式。
t分布的检验值为
tJ
SEx
检验值为
SEx
Z
SEx或
此外,当2未知时,两个样本均数之差(x1x2)的分布、相关系数的分布、回归
系数的分布等也服从近似正态分布。
参数估计
第一节统计推断的有关问题
一、什么是推断统计
推断统计就是指由样本资料去推测相应总体情况的理论与方法。
也就是由部分推全体,由已知推未知的过程。
推断统计根据推测的性质不同而分为参数估计和假设检验两方面。
参数估计是用样本去
估计相应总体的状况,其具体方法有点估计和区间估计。
假设检验的主要用途是对出现差异
的两个或多个现象或事物进行真实性情况的检验,又称统计检验。
它又为参数检验和非参数
2
检验。
参数检验法在检验时对总体分布和总体参数(,)有所要求,而非参数检验法
在检验时则不依赖于总体的分布形态和总体参数的情况。
二、统计推断的基本问题
进行统计推断时应首先考虑以下三个方面的问题。
一是关于统计推断的基本前提。
统计推断的前提是随机抽样。
进行统计推断时,首先要了解抽样的方式,是随机抽取的,还是人为抽取的。
二是样本的规模与样本的代表性。
抽样研究需要有一定的样本规模,而样本要具有代表
性也需要有一定的样本规模来保证,以减少抽样误差。
值得注意的样本规模和样本代表性是
空间和条件下得出的结但这种错误要有一定的
建立在随机抽样基础之上的,否则即使样本再大也是无意义的。
三是统计推断的错误要有一定限度。
统计推断是在特定的时间、
论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。
限度,统计推断中允许犯错误的限度是用小概率事件来表示。
第二节参数估计的原理
一、参数估计的定义
所谓参数估计就是根据样本统计量去估计相应总体的参数。
二、参数估计的方法
(一)点估计
作为总体参数的估计值。
点估计是在参数估计中直接以样本的统计量(数轴上的一个点)
良好点估计的统计量必须具备一定的前提条件。
1.无偏性
则要分析无偏估计量的变异大小的情况。
无偏估计量变异性小的,有效性较高;无偏估计量变异性大的,则有效性较低。
用统计量一—样本均数作为总体参数的估计值是最佳选择。
4.充分性
充分性是指一个容量为n的样本统计量是否充分地反映了全部n个数所反映的总体信
息。
(二)区间估计
区间估计是以一个统计量的区间来估计相应的总体,它要求按照一定的概率要求,根据
样本统计量来估计总体参数可能落入的数值范围。
区间估计是用两个数之间的距离或数轴上
的一段距离来表示未知参数可能落入的范围。
xSExTn
2.
置信区间、置信系数和置信限
1.96X中有三个重要概念,置信区间、置信系数和置信限。
置信区间是指在特定的可靠性(即置信系数)要求下,估计总体参数所落的区间范围,
置信系数是指被估计的总体参数落在置信区间内的概率D,或以1表示。
又叫置信
水平、置信度、可靠性系数和置信概率。
置信系数是用来说明置信区间可靠程度的概率,也是进行正确估计的概率。
一个置信系数同时反映了在做出一个估计时所犯错误的小概率
(),即可靠性为95%寸,意味着犯错误的概率为5%;可靠性为99%寸,意味着犯错误的概率为1%
置信限是被估计的总体参数所落区间的上、下界限,即
X1.96XVVX1.96X
例8-1:
某次测验中有10个正误判断题,试问在置信系数为0.95时,能猜对多少道题?
根据二项分布的平均数与标准差公式,有
1
5
210丄
2
1.585
3.置信区间与置信系数的关系
在进行参数估计时,一般人首先想到的是选用一个较高的置信系数,以为这样就会得到
一个精确度很高的估计值。
然而,实际情况并非如此,一个较高的置信系数并不意味着有一
个较精确的估计。
事实上高的置信系数会造成置信区间的扩大,而一种跨距很大的区间本身
又会降低估计精确性,结果只能给我们一个非常模糊的估计数。
如例8-1,D0.95
时,2〜8;D0.99时,1〜9。
因此置信系数和置信区间在估计时应综合考虑。
当
置信区间过于宽大时,即使估计达到了99%的置信系数,其估计结果可能很少有真实的价值;相反,置信区间过于狭窄,其估计与一个低水平的置信系数相联,估计结果的真实价值也值
得怀疑。
一般来说,最佳的估计既要求置信区间适度,又要求置信系数较高。
第三节总体均数的估计
一、均数估计的标准误
当总体b2已知时,根据中心极限定理三有
其区间估计公式为
X1.96
X2.58
二、总体均数的估计方法
(一)正态估计法,b2已知一是总体呈正态时,不论样本容量的大小,样本均数的分布都呈正态分布。
二是总体呈非正态时,只要样本容量大于30,样本均数的分布呈近似正态分布。
例8-2:
已知某总体为正态分布,其总体标准差为10。
现从这个总体中随机抽取n1=20,
n2=30的两个样本,其平均数分别80和82。
试问总体参数□在0.95和0.99的置信区间是多少。
1)分析条件,判断方法
2100)已知,所以可用
根据题目信息可知,总体分布为正态,且总体方差已知正态法进行估计。
2)
求样本均数的标准误
X6
■X亦
SEX1
10
2.24
X1
Tn720
SEx2
10
1.82
(二)t分布估计法,b2末知
应用条件是总体呈正态,样本容量无论大小,都可以采用t分布估计法。
不过,若n<30
时,必须用t分布法;若n>30时,既可用t分布法,也可用近似正态估计的方法。
例8-3:
假设从某市随机抽取小学三年级学生60名,测得其体重平均为28公斤,标准
差为3.5公斤。
试问该市小学三学生的平均体重大约是多少?
1)分析条件,判断方法
本例总体分布为正态(因为人类身高的分布已知是正态的)。
总体方差未知,但样本标
准差已知,且样本容量大于30,既可用t分布估计法,也可用近似正态估计法。
此处用t分
布法。
3)求置信区间
t分布的中置信系数D对应的t值与正态分布中置信系数D对应的Z值不同。
后者的不论样
本容量的大小,其相同置信系数的Z值都相同,是一个常数。
前者在相同的置信系数下,t
值会随样本容量或自由度的变化而不同。
因此,t分布估计法的置信区间为
Xtn0.05SEx
Xtn0.01
SEx
为此,需根据自由度
[dfn
n
1]查附表2“t分布显著性临界值表”,
本例,dfn
601
时,
t590.05
2.00,t590-012.66,所以有
282.00
0.46
28
0.92
27.08~28.92
282.66
0.46
28
1.22
26.78~29.22
确定t值。
例8-4:
现从某年级的数学成绩中(假设总体正态)随机抽取12名学生的成绩为93,
70,90,92,69,95,82,83,88,81,84,77,试估计该年级的总体平均数在95%和99%
置信度时的区间。
1)分析条件,判断方法
本例总体为正态,总体方差未知,且样本容量小于30,用t分布估计法。
因为原始数据,还需计算样本均数和标准差。
2)计算样本均数和标准差
1004
83.67
12
[84802__10042'12门—
(8.仃
4)求置信区间
当df121
11时,
t110.052
2.20
t110.0123.11
83.67
2.20
2.46
83.67
5.41
78.26~89.8
83.67
3.11
2.46
83.67
7.65
76.02~91.32
95%可能为78.26〜89.80分,有99%可能为76.02〜91.32分。
n>30就近似正态估计法。
该年级学生的平均成绩有
(三)近似正态估计法总体分布为非正态时,只要
例8-5:
某校100名参加进行了一次化学效标参照测验(已知总体分布为偏态),其平均成
绩为52.1分,标准差为9.7分,试问以95%的置信度进行估计该校所有学生的化学平均成绩会落在什么范围?
30,只能用近似正态估计法。
1)分析条件,判断方法总体分布为非正态,总体方差未知,但样本容量大于
2)求均数的标准误
SS
SEXSEX〒
或或Vn
3)求置信区间
第一节假设检验的原理与方法
一、差异及差异显著性检验
差异问题主要来自两大方面。
一种一种是因抽样的随机性而出现的抽
(一)差异产生的可能情况
所谓差异是指两个或多个事物之间出现差别或不同。
是事物本身存在着差异,称为真实的差异或实质性差异;差误差。
抽样误差在统计上是忽略不计的,被视为不存在真正的差异。
(二)差异显著性检验
事物出现差异,可能是误差,也可能是实质性差异。
究竟属于哪种情况,必须借助统计方法进行分析、权衡,才能作出合乎逻辑的结论。
若经统计检验发现差异超过了所规定的某一误差限度,表示差异已不属误差了,这在统
计上称差异显著。
若未达到规定的误差限度,表明属误差,亦称差异不显著。
这种对事物差
异所进行的检验就是差异显著性检验。
(三)差异显著的界限
差异需要达到什么样的误差界限才算显著呢?
统计中得利用小概率原理作拒绝假设或
接受假设的依据,若抽样结果是小概率事件就拒绝假设,否则就接受假设。
通常把概率不超
过0.05(即5%或0.01(即1%作为抽样误差的限度。
二、假设与假设检验
科学理论的建立需经过四个阶段,即发现问题、提出假设、形成假说、建立理论。
在假设过程中一般需要提出两个基本假设,一是研究假设,二是与之对立的虚无假设。
(一)研究假设(alternativehypothesis)
研究假设就是实验人员希望证实的假设。
从内容上看,研究假设是假设两个样本统计(或两个总体参数)之间,又或者是样本统计量与总体参数之间存在真实的差异,是一种有差假
设。
表达方式有二,即X或X0;12或120。
(二)虚无假设
虚无假设是研究人员为了证实研究假设是真的而利用概率论的反证法所进行的假设,即
从研究假设的反面进行假设,用符号Ho表示。
建立起虚无假设目的是希望通过检验说明虚
无假设是假的,以此来证明研究假设是真的。
因此,假设检验都是从虚无假设开始的。
是一种无差假设,又称零假设或原假
12或120。
从内容上看,虚无假设是假设两个总体参数之间或样本统计量与总体参数之间不存在真正的差异,其现存的表面差异是由抽样所造成的误差,设。
表达方式有二,即X或X0表示;
三、显著性水平
(一)显著性水平的意义
显著性水平指拒绝虚无假设的小概率值。
从理论上说,显著性水平的理论依据来自小概率事件来。
统计中一般认为概率小于或等
于0.05的随机事件属小概率事件。
若随机样本统计量的数值在抽样分布上出现的概率等于或小于这些小概率值,就以小概率事件拒绝虚无假设。
从直观上看,当两个总体均数相等时,1和2会落在Z轴的同一点上,即Z0处,
当1和2有差异时,则会产生差距,其差距在Z轴上达到或超出±1.96时,就被认为出现显著差异,因此±1.96之内称接受虚无假设的概率区,其包含的面积达95%。
只要两均数差异检验的Z值落入该区域,就认为差异不显著,这时应接受虚无假设而拒绝研究假设。
而±1.96之外称则拒绝虚无假设的小概率区,其包含面积为5%称小概率值,即
0.05。
只要两均数差异检验的Z值落入这一区域,就认为存在显著差异。
这时应拒绝虚无假设而接受研究假设。
(二)差异显著性的判断规则
表9-1Z值、P值与差异显著性的关系
CV
P值
显著性
符号表示
<1.96
>0.05
不显著
>1.96
<0.05
显著
*
>2.58
<0.01
极显著
**
表9-2t值、
P值与差异显著性的关系表
CV
P值
差异显著性
符号
>0.05
不显著
>t(n')0.05
<0.05
显著
*
>t(n')0.01
<0.01
极显著
**
值得注意的是,显著性水平的取值实际上是因事物的性质、统计的要求及研究者的需求
不同确定的。
虽然我们比较习惯取a=0.05和a=0.01,但也可以取其它的显著性水平值,
如0.005或0.001。
小概率值a越小,表明显著性水平越高;反之,显著性水平越低。
(三)显著性水平与与置信水平的关系
假设检验和参数估计都试图回答两个相同的问题,一是样本信息能告诉我们关于总体的什么
信息,二是据此我们能推论出什么结论。
假设检验是当样本统计量超过一定的标准(如0.05
的显著性水平)时,就说统计显著(即拒绝零假设),而参数估计则是要找到总体值所落入
的可靠范围。
而作为两者代表性指标一一显著性水平和置信水平也是从不同的角度回答相同的问题,因此,两者一起使用比单独使用更能清楚地显示数据的情况。
四、差异显著性的检验方法
(一)双尾检验
双尾检验是把拒绝性的概率值置于理论分布的两端或两侧,也称双侧检验。
双尾检验是在研究人员还不能确定两种处理所得结果谁优谁劣,检验的目的只是确定事
物之间是否存在明显差异时所采取的检验方法。
这时只要Z>1.96或|t|>tno.05,即实际
双尾检验时其显著性水平值的标
计算的Z值落在拒绝区域,就可以推断两个均数之间的差异是显著的。
所以,双尾检验的实际意义是只推断差异是否存在,而不大断言差异的方向。
记方法为0=0.05/2或0=0.01/2。
(二)单尾检验
也称单侧检验。
这种检验方法
单尾检验是把拒绝性概率值置于理论分布的一尾或一侧,是研究者根据已有的资料事先能够预料到谁优谁劣,检验只是为了进一步确证而选择的方
法。
单尾检验因拒绝性概率是置于理论分布的右侧还是与左侧,又分为左尾检验和右尾检验。
1.右侧检验。
右侧检验是把拒绝性概率值置于理论分布的右侧,见图9-4。
当研究人
员能够预料到一个总体的参数(如11)大于另一个总体的参数(12)时,可采用右侧检验。
其假设形式为
Ha:
11>12
(卩1)小于另一个总体参数(卩2),可采用左侧(尾)检验。
其假设形式为
2.左侧检验。
左侧检验是把拒绝性概率值置于理论分布的左侧。
当研究者能够预料一个总体参数
Ho:
Ha:
CV)是不同的。
11<12
注意:
在同一个显著性水平上,单尾检验和双尾检验的临界值(
表9-3两种检验方法临界值、P值和显著性水平的比较表
双侧检验的CV
单侧检验的CV
P
差异显著性
<1.96
<1.645
>0.05
不显著
>1.96
>1.645
<0.05
显著
>2.58
>2.33
<0.01
极显著
五、统计决策的两类错误
(一)错误和错误
错误是指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使我们作出了拒绝虚无假设的结论,又称I型错误(typeIerror)。
犯
错误的概率是检验之前经过深思熟虑所选定的显著性水平值。
错误是指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域,致使我们作出了接受虚无假设的结论,说明事物之间没有显著的差异,又称n型
错误(typenerror)。
接受H0拒绝H0
正确决策
错误
错误
正确决策
Ho为假
Ho为真
错误和错误的关系及控制
如前所述,建立虚无假设的目的并不在于证明它的正确性,而是随时准备拒绝它。
因此
在拒绝待检验的虚无假设(Ho)的同时,我们就在冒犯错误的风险。
因为虚无假设的客
观真伪性我们并不知道,显著水平值标志着冒这种风险的可能性大小。
所以理想的办法
就是把冒这种风险的可能性尽量减小。
然而显著性水平值和犯错误的概率之间又存
在着一种密切关系,即减小了犯错误的风险,必定会增大犯错误的风险;同样,减小
犯错误的风险,又会增大犯错误的风险。
由此可见,想要同时减小犯两类错误的风险
是不切实际的。
对于错误来说,可以通过控制显著性水平来减小犯错误的概率。
一般而言,如果实验条件控制的较好的话,可以取=o.o5;如果实验条件难以控制,则可以取=o.o1或更
高的显著性水平值。
错误与错误不同,它并不是检验之前规定的。
影响的因素主要有三。
一是在参
数检验中,依赖于参数的实际值与假设值之间的距离。
实际值与假设值相差越大,会
越小。
二是与检验前选定的有关,越小,越大,因此要同时降低和,需要增
加样本容量(n)。
三是当和n固定时,根据研究问题性质选择适当的检验类型可以减小
。
由此可见,对于错误而言,控制是比较困难的。
因此一般在规定的下,采用增大
样本容量的方法来尽量减小。
六、假设检验的基本步骤
(一)提出(或建立)假设。
即同时建立虚无假设Ho和研究假设Ha。
(二)规定或选择显著性水平。
在教育与心理统计中常选择a=0.05和a=0.01。
所以
在实际检验中,这一步骤可省略。
(三)计算检验值。
计算假设检验中的各种统计量。
(四)比较与决策。
将计算的检验值与相应的临界值进行比较做出统计决策。
第二节两均数差检验的条件与问题
一、均数之差检验的前提条件
(一)统计量来自随机样本
(二)总体呈正态分布
(三)总体的方差齐性
总体方差齐性是指两个总体之间的方差相等或一致,即
二、检验两均数差应考虑的问题
(一)总体情况
总体方面,一要考虑总体的分布情况,是正态的还是非正态的;二要考虑总体方差值,
是已知的还是未知的;三要考察总体方差的一致性,是齐性的还是不齐性的。
这些内容的不同,其检验方法也不同。
(二)样本类型
1.独立样本。
独立样本是指从两个无关的总体中随机抽取的两个或多个样本,或者说是独立抽取的,彼此间的数据不存在对应关系的样本。
2.相关样本。
相关样本是从具有一定程度相关的总体中抽取的两个或多个样本,亦即
彼此的观测值之间存在一一对应关系的样本。
在相关样本中,常见的形式有两种:
一是同组
比较,即同一组被试先后接受两种不同的实验处理,得到两组具有对应关系的数据。
二是配
对比较,即先将同质的被试两两配对,再把各对中的两个被试分别分开,让其接受不同的实
验处理,这样也可以得到两组一一对应的数据。
这种用配对方式得到的相关样本称配对样本。
t分布模型和近似正态分布。
(三)总体情况、样本含量与数学模型的关系
检验方法
Z检验
t检验
Z检验
总体
情况
正态分布,b2已知
n不论大小
n>30
b2未
知
正态
n>30
n不论大小
n>30
非正态
n>30
n>30
数学模型
正态分布模型
t分布模型
近似正态模型
在两个均数的检验中,常用数学模型是正态分布模型,