张文彤SPSS第10节初中高课程假设检验.docx

上传人:b****0 文档编号:17217974 上传时间:2023-07-23 格式:DOCX 页数:13 大小:316.77KB
下载 相关 举报
张文彤SPSS第10节初中高课程假设检验.docx_第1页
第1页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第2页
第2页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第3页
第3页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第4页
第4页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第5页
第5页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第6页
第6页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第7页
第7页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第8页
第8页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第9页
第9页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第10页
第10页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第11页
第11页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第12页
第12页 / 共13页
张文彤SPSS第10节初中高课程假设检验.docx_第13页
第13页 / 共13页
亲,该文档总共13页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

张文彤SPSS第10节初中高课程假设检验.docx

《张文彤SPSS第10节初中高课程假设检验.docx》由会员分享,可在线阅读,更多相关《张文彤SPSS第10节初中高课程假设检验.docx(13页珍藏版)》请在冰点文库上搜索。

张文彤SPSS第10节初中高课程假设检验.docx

张文彤SPSS第10节初中高课程假设检验

假设检验

为什么要做检验?

因为取得的样本的信息

样本背后的总体是怎样的。

总体参数

参数估计:

推估样本所在的总体体征。

假设检验:

对提出的一些总体假设进行分析判断,做出统计决策。

假设检验基本原理

例如:

现有样本均数和已知总体均数不同,其差别可能有两个方面的原因造成。

其一,样本来自,已知总体,现有差别是抽样误差

其二,样本来自,其他总体,两个总体存在本质上的差异。

选择哪种解释呢?

需要借用假设检验。

基础:

小概率原理,即一般认为小概率事件在一次随机抽样中不会发生。

基本思想:

先建立一个关于样本所属总体的假设,考察在假设条件下随机样本的特征信息是否属小概率事件,若为小概率事件,则怀疑假设成立有悖于该样本所提供特征信息,因此拒绝假设。

事实上,小概率事件在随机抽样中还是可能发生的,只是发生的概率很小。

若正好碰上了,则假设检验的结论就是错误的。

当然,犯这种错误的概率很小。

一、建立假设

根据统计推断的目的而提出的对总体特征的假设。

统计学中的假设有两方面的内容:

一是检验假设(hypothesistobetested),亦称原假设或无效假设(nullhypothesis),记为H0;

二是与H0相对立的备择假设(alternativehypothesis),记为H1。

后者的意义在于当H0被拒绝时供采用。

两者是互斥的,非此即彼。

H0:

m=m0,H1:

m≠m0;

例H0:

m=7.4,H1:

m≠7.4。

二、确定检验水准

实际上就是确定拒绝H0时的最大允许误差的概率。

检验水准(sizeoftest),常用a表示,是指检验假设H0本来是成立的,而根据样本信息拒绝H0的可能性大小的度量,换言之,a是拒绝了实际上成立的H0的概率。

常用的检验水准为a=0.05,其意义是:

在所设H0的总体中随机抽得一个样本,其均数比手头样本均数更偏离总体均数的概率不超过5%

3、进行试验收集数据

所需的样本数据即从此得来

4、计算检验统计量和P值

统计量只是工具,概率值才是目的,它可以客观衡量样本对假设总体偏离程度,从H0假设的总体中抽出现有样本(及更极端情况)的概率,即P值

例如600次赢100次是H0假设的情况,只赢1次就是现有样本情况,更极端的情况就是连一次也没有赢。

检验统计量的特点

该统计量应当服从某种已知分布,从而可以计算出P值

各种检验方法所利用的分布及计算原理不同,从而检验统计量也不同

初学者往往本末倒置,很认真地在学工具,却忘记了统计学的本质是思维方式

五、得出推断结论

按照事先确定的检验水准a界定上面得到的P值,并按小概率原理认定对H0的取舍,作出推断结论

若P≤α

基于H0假设的总体情况出现了小概率事件

则拒绝H0,接受H1,可以认为样本与总体的差别不仅仅是抽样误差造成的,可能存在本质上的差别,属“非偶然的(significant)”,因此,可以认为两者的差别有统计学意义。

进一步根据样本信息引申,得出实用性的结论。

若P>αa

基于H0出现了很常见的事件

则样本与总体间的差别尚不能排除纯粹由抽样误差造成,可能的确属“偶然的(non-significant)”,故尚不能拒绝H0

因此,认为两者的差别无统计学意义,但这并不意味着可以接受H0。

例子:

关于掷筛子的假设检验

建立假设

H0:

筛子均匀,pi=1/6H1:

筛子不均匀

确定检验水准

aα=0.05

进行试验,计算检验统计量和P值

相应的试验结果在H0下对应的概率为1/600略多一点

得出推断结论

基于H0出现了小概率事件,结果有非常非常显著的统计学意义,你出老千!

假设检验应注意的问题

结论不能绝对化

本身就保留了犯错误的可能性

样本量导致的检验效能问题

样本量太小,导致检验效能不足,从而无法检出可能存在的差异

样本量太大,得出的有统计学意义的结论可能根本就没有实际意义

统计学的意义和实际价值的意义要分清。

单样本t检验

推断样本是否来自某已知总体,即要检验样本所在总体的均数是否等于已知的总体均数

为了回答该问题,统计学上采用了小概率反证法的原理:

我们有如下两种假设:

H0:

样本均数与总体均数的差异完全是抽样误差造成

H1:

样本均数与总体均数的差异除由抽样误差造成外,也反映了两个总体均数确实存在的差异

t=x-u/s(分子为均差)/(分母为标准误差)

标准误越小代表性越好。

单样本t检验在spss中的实现

选择个案——分析——单样本t检验

(显示P值,连续双击sig.)

例:

消费者信心指数以100作为基准值,现希望比较2007年12月的总消费者信心指数是否与基准值有差异

解释:

样本均值为94.1391与比较值100之间相差5.86088,p值为.000

平均差为5.86088

如果说,背后总体均数为100的话,那么在这样一个总体中抽样,得到现在极端的样本,平均差为5.86088,更极端的情况是再抽出的样本均数与100之间的差值绝对值还要大±,所有这些极端情况,在100次抽样里,连一次也没有。

我们设定的α值为0.05,而P值实际大概为10-5我们有理由认为,在原假设成立的条件下,做1次研究,得到现有极端样本的可能性是很小的。

拒绝原假设,接受备择假设。

就是该样本背后的总体均值不等于我们假设的100。

问题:

那该总体均值到底是大于100还是小于100呢?

根据样本均值估计,总体均值小于100(统计之外的推断,基于应用考虑)

方法的适用条件

因为有中心极限定理,一般均数的抽样分布都不会有问题,真正会限制该方法使用的是均数是否能够代表相应数据的集中趋势。

也就是说,只要数据分布不是强烈的偏态,一般而言单样本t检验都是适用的。

不符合t检验的条件时方法(样本不符合正态分布等)

引申:

基于计算统计学的新工具:

Boostrap抽样(高精尖方法)

基于现有样本里进行反复抽样反复计算,默认计算1000次,得出更委托的结果。

默认执行就行。

解释:

平均值的偏差很小说明,均值具有代表性,符合算数平均数的使用条件,均数可以代表样本。

标准差的偏差很小,说明该样本可以代表总体的离散程度

解释:

之前算得的平均差为-5.86088,偏差很小,P值为0.001说明结果同样支持拒绝原假设。

完全随机的两样本t检验

目的:

推断两个样本是否来自相同的总体,更具体地说,是要检验两样本所代表的总体均数是否相等。

检验假设

无效假设H0:

u1=u2

备择假设H1:

u1≠u2

检验水准α=0.05

统计理论复习

和上面单样本的t检验的原理相同,我们也采用了小概率反证法。

首先假设H0:

两样本来自同一总体。

当该总体服从正态分布时,我们就可以采用两样本t检验来计算从该总体中抽得这样两个样本(及更加极端情况)的概率为多少,从而做出统计推断。

样本均差/离散程度=标准化

由于H0假设的是两样本来自同一总体,分析目的只涉及到均值,因此两样本t检验在推导过程中除了要求总体服从正态分布外,还要求两样本各自所在总体方差相同。

应用条件不被满足

情况较轻时可以采用校正t检验的结果

否则应使用变量变换使之满足条件

或采用非参数检验过程

例:

现希望评价2007年4月第一次调查时不同收入人群的消费者信心指数是否存在差异

分析:

数据为定量资料,设计为成组设计,目的是两样本均数的比较。

正态性:

可作直方图等。

方差齐性:

系统在t检验结果中自动给出。

操作:

检验变量和分组变量分别选入,输入定义组——确定。

解释:

分析:

两组均值分别为90.7和104.4,这两个数存在差值,到底是由于抽样误差造成的还是它们背后的总体差值不同呢?

进一步看下列检验

3个检验结论,

第1个检验——方差齐性检验(列文检验)适用条件检验该检验的原假设如下

H0:

方差无区别或者方差相等。

H1:

两样本方差是有区别的不相等的。

根据sig.值来判断

例中

P值为.001,说明2个样本均值分别为90.7和104.4背后所代表的总体的方差是不相等的。

当,方差齐性被拒绝说明,t检验的适用条件已经出问题了。

怎么办呢?

再回看上表——假设方差不相等(校正)后的结果,即上图表中的第2行。

校正后的t值和df和sig.值

根据sig.值进行判断:

两样本的总体均值是有显著差异的

谁高谁低,就由平均值来判断。

往往在写统计结果的时候,出现显著性差异时要将差异值报告出来。

t检验适用条件

独立性:

对结果的影响较大,但一般没问题(从文献资料中进行判断)

正态性:

有一定的耐受能力,可以通过直方图等进行观察,偏的不厉害就行

注意应当要分组考察

方差齐性:

相对而言对结论的影响较大,需要进行方差齐性检验(t检验时最重要的,首先要考虑的,spss中t检验表首先出来的是方差齐性检验)

配对样本t检验

配对设计的两种情况

对同一个受试对象处理前后的比较

将受试对象按情况相近者配对(或者自身进行配对),分别给予两种处理,以观察两种处理效果有无差别。

配对设计的特点

在配对设计得到的样本数据中,每对数据之间都有一定的相关,如果采用成组的t检验就无法利用这种关系,浪费了大量统计信息

对于这种情况,统计学上的解决办法是求出每对的差值,通过检验该差值总体均数是否为0,就可以得知两种处理有无差异。

基本思路

H0:

两总体均值无显著差异,差值序列均值u0=0

构造统计量:

同单样本均值检验

D=X-u0S为差值序列的标准差

实质是先求出每对测量值的差值;然后检验差值序列的均值是否与0有显著差异.

如果差值的均值与0有显著差异,则认为两总体均值存在显著差异;否则,与0无显著差异,则认为两总体均值不存在显著差异

功能实际上和单样本t检验重复,但数据输入格式不同

和方差分析结果等价

例子:

用某药治疗10名高血压病人,对每一病人治疗前、后的舒张压(mmHg)进行了测量,结果如下,问该药有无降压作用?

计算变量——目标变量(命名)——输出新的一列数据——根据这列数据进行单样本t检验

解释:

分析:

表2,按照h0等于0的假设进行检验,得到P值为0.027,说明,原假设要成立的话在均值为0的总体中抽样,抽得均值相差10甚至比10更大的数的,在100次当中只能抽到2.7次。

这个概率值是小于检验水平的,因此拒绝H0接受H1,认为均值的差值不等于0。

又因为样本均值差值大于0,所以总体的均值差值也大于0,意味着药物是有降压作用的。

配对样本t检验

不用相减,直接用配对样本t检验

研究设计——样本量确定(根据文献来)

配对设计10-20个样本量的数据基本足够。

样本量的确定要考虑

第一:

研究设计

第二:

样本流失量

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2