教育与心理统计学复习要纲.docx
《教育与心理统计学复习要纲.docx》由会员分享,可在线阅读,更多相关《教育与心理统计学复习要纲.docx(17页珍藏版)》请在冰点文库上搜索。
教育与心理统计学复习要纲
《教育与心理统计学》复习思考题答案
一、简答题
(第一部分)
1.简述条图、直方图、圆形图(饼图)、线图以及散点图的用途
答:
这几种图是统计学中最常用的图形,条图和直方图都用于表示变量各取值结果的次数或相对次数,即次数分布图。
不同的是前者用于离散或分类变量,后者用于连续变量(分组后)。
圆形图用于表示离散变量的相对次数,即频率,整个圆面积为1,各扇形块表示各类别的频率。
线图用于表示连续变量在某个分类变量各水平上的均值,如各年级的考试成绩均分,常用于组间比较中。
散点图用于两连续变量的相关分析,可将两变量成对数据的值作为横、纵坐标标于图上,根据散点的形状可以大致判断两变量是否存在相关以及相关的程度。
2.简述正态分布的主要应用
答:
正态分布的应用主要牵涉到通过查标准正态分布表进行Z分数和概率之间的转换。
其主要应用可以分为已知录取率求解分数线问题及其反问题,即已知原始分数或根据特定界限求解录取率或考生人数。
分数线问题主要是根据录取率确定合适的查表概率(中央概率),查得Z分数并转换为原始分数;后者则主要是通过将原始分数或界限标准化,查表得到概率然后求解录取率或考生人数。
此外,这种关系在测量中等级分数或难度的等距化、测验分数的标准化等程序中也有应用。
3.简述T检验和方差分析法在进行组间比较上的区别和联系
答:
T检验和方差分析法的共同点是:
它们都是推断统计的主要方法,都可以用于检验组间差异,即通过比较自变量(性质变量)的各水平在因变量上的差异对自变量的效应进行判断。
它们的区别是:
T检验主要是基于T分布理论,只能用于检验两组之间的差异,即其分析的自变量只能有两个水平;而方差分析则主要用于多组比较。
另一方面,T检验还可以对单个总体参数的显著性进行检验,而方差分析法作为一般线性模型,可以同时处理多个自变量在多个因变量上的效应检验问题。
4.简述Z分数的应用
答:
Z分数的应用主要有:
①表示各原始数据在数据组中的相对位置;②对于正态数据,可表示该数据以下或以上数据的比例,具体说可以求解诸如分数线问题或人数比例问题;③表示标准化测验的分数;④用于异常值的取舍。
5.简述卡方配合度检验和卡方独立性检验的区别
答:
卡方配合度检验主要用于检验单个名义型变量多个分类上的实计数和某个理论次数分布(如均匀分布)之间的差异显著性,因此可以将之理解成多组之间次数比较的方法;卡方独立性检验主要用于检验两个名义型变量各项分类上的次数之间是否存在显著关联,是考察名义型变量间相关性的方法。
6.简述方差分析法的步骤
答:
方差分析法的步骤是:
①和一般的假设检验一样设立零假设和研究假设;②根据实验设计的类型确定各变异源,进行相应的平方和分解,即有几个变异源就从总平方和中分解出几个平方和;③根据平方和分解得到各变异源对应的自由度,即进行总自由度的分解;④根据研究的目的和实验设计考虑要检验什么效应,从而将其对应的平方和比上相应的自由度得到该效应的均方,其中误差均方必须计算;⑤将各待检验效应的均方比上误差的均方,构造各F统计量;⑥将计算来的各F统计量值和F检验的临界值进行比较得出统计结论,其中临界值的分子自由度和分母自由度分别是待检验效应的自由度和误差自由度;⑦(可不答)如果效应检验结果显著,可以进入事后检验,即对多水平的自变量进行多重比较考察各水平间的具体差异,如果是多因素方差分析,交互作用效应检验显著,也可以进入简单效应检验具体考察交互作用的情况。
7.简述方差和差异系数在反映数据离散程度上的区别和联系
答:
方差反映了数据的变异或离散程度,即数据偏离平均数的程度,方差越大表示数据离散程度越大;而差异系数则反映了该组数据以平均数为单位的离散程度。
它们的区别主要是方差一般不能直接用于两组数据间相对离散程度的比较,尤其是当两组数据的水平差异较大时。
但特殊情况下如果数据的水平相当,且是同质数据,则可以直接由方差看出两组数据相对离散程度,这时它和差异系数的功用相同。
8.简述回归分析法最小二乘法的思路
答:
回归分析法的目的是建立因变量的期望值和自变量之间的函数关系式,称为回归模型,最小二乘法认为,这样的回归模型应当使模型中的期望值和实际观测数据之间的误差达到最小,最小二乘就是指所有的误差项平方和达到最小。
然后再通过求解达到该最小值时的未知参数得到函数关系式。
这就是最小二乘法的基本原理。
9.简述完全随机化设计和随机区组设计进行方差分析的区别
答:
两种设计方差分析的区别主要在于总平方和分解不同,不同的设计实际上对应了研究者对实验中可能对因变量产生效应的各变量的不同考虑,因此方差分析时的变异源也当然不同,所以总平方和分析出来不一样,如随机化设计只分解出组间和组内两部分,把组内当成误差,而区组设计则还要在组内部分中分解出区组变异和残差变异。
平方和分解变了,当然后面对应的自由度分解,均方的计算和F统计量的构造数量都有所不同。
10.简述假设检验中两类错误的区别和联系
答:
假设检验中的两类错误指α型错误和β型错误,前者又称为弃真错误,指当零假设为真时错误地拒绝了它,因此其大小等于事先设置的显著型水平,即0.05或0.01;后者又称为取伪错误,指当零假设为假时错误地接受了它。
二者性质不同,前提条件不同,这是它们的区别。
两类错误的联系是:
它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在总体间真实差异不变情况下,它们之间是一种此消彼长的关系,因此,不可能同时减小两种错误的发生可能,常用的办法是固定α的情况下尽可能减小β,比如通过增大样本容量来实现。
11.简述多重比较和简单效应检验的区别
答:
多重比较又称事后检验,是紧接着方差分析后的分析步骤,当方差分析结果显示某变量主效应显著时,用多重比较进一步分析差异具体在该变量的什么水平上。
简单效应检验针对的是两个变量或多个变量间的交互作用,也是方差分析后的步骤,当交互作用显著时,用简单效应检验考察某变量的效应在另一个变量的不同水平上的差异情况。
12.简述卡方检验的主要用途
答:
卡方检验主要可以用于处理计数数据的拟合问题。
具体说,它可以检验单变量多项分类上的实计数和理论次数分布之间的差异显著性,称为配合度检验;也可以检验两个变量各项分类上的次数之间是否存在显著关联,称为独立性检验。
卡方检验主要是处理计数数据的统计方法,由于其对数据的分布不像参数检验那样通常要求正态,因此也被认为属于非参数检验法。
13.简述平均数显著性检验和平均数差异显著性检验的区别和联系
答:
两种检验都是基本的假设检验问题,都是基于同样的抽样分布(正态分布或T分布)进行的推断统计,而且差异显著性问题的解决是通过将问题转换为显著性检验问题。
这是二者的联系,区别是显著性检验用于解决单个未知平均数和一个已知总体均值之间的差异显著性,而差异显著性检验则是检验两个未知总体平均数是否存在显著差异,所以也可以将前者理解为单参数问题,而将后者理解为双参数问题。
此外,由于双参数问题更为复杂,其公式和不同的条件也较多,除了和单参数问题一样要考虑数据总体的分布、母总体参数是否已知之外,还要考虑两样本是否独立,两总体的方差是否相等等。
14.简述假设检验中零假设和研究假设的作用
答:
假设检验使用的是一种反证法的思想,研究者关心的本来是研究假设,即存在差异,但直接进行推断往往行不通,所以借用反证法思想,通过检验研究假设的对立面--零假设来创造推理的条件简介对研究假设进行推断。
零假设往往是推理的基础,通过推理拒绝或接受零假设,就可以接受或拒绝研究假设。
15.简述条图、饼图和直方图用法的区别和联系
答:
统计图形常可用来帮助直观地了解数据中的信息,正确使用统计图形的关键是要区分各种图形的用途。
同样是表达数据的次数分布,条图、饼图和直方图各有特点,用途也有差别:
条图用于离散或分类变量各取值结果的次数或相对次数分布,直方图用于连续变量(分组后)在各分段上的次数或相对次数分布;它们都是用直条高度表示次数,但条图的横坐标没有单位,而直方图的横坐标有意义,其直条连在一起。
圆形图用于表示离散变量的相对次数,即频率,整个圆面积为1,各扇形块表示各类别的频率,因此其包含的信息比一般的条图要丰富一些。
16.简述什么是抽样分布
答:
抽样分布又称为基本随机变量函数的分布,即样本统计量的理论分布;是利用各种样本统计量对总体参数进行推断的基础。
常见的抽样分布如正态分布、T分布、卡方分布、F分布等。
17.简述统计量和参数的区别和联系
答:
统计量和参数都是反应数据特征的数量,但它们分别是相对于样本和总体而言,统计量是反映样本特点的数字特征,而参数时反应总体特点的数字特征。
它们经常联系在一起,实际上推断统计就是利用样本统计量来对总体参数进行估计或者假设检验。
18.简述相关分析和回归分析的区别和联系
答:
相关分析和回归分析的联系是:
它们通常都是基于两正态连续变量的假设,都是处理两变量间相互关系的统计方法,通常两种方法不同时出现在文章中;二者的区别是作为相互关系分析的方法,相关分析是通过提供一个相关系数来考察两变量间的联系程度,而回归分析则是重在建立两变量间的函数关系式,因此通常可以先考察相关系数的显著型,如果显著则可以进一步考虑建立变量间的回归方程。
此外,相关分析和回归分析又各有一些具体方法用于处理不同的情况,如相关分析还包括等级相关、质量相关和品质相关,回归分析还包括非线性回归等。
19.简述积差相关系数和等级相关系数间的区别
答:
两种相关分析法都是常用的相关系数计算公式,区别是:
积差相关系数用于正态等距或等比数据,其对数据的要求比较高,结果也比较精确;而当无法确定数据是否服从正态,或者数据是等级数据时,使用斯皮尔曼等级相关系数。
因此其应用范围较广,但结果精确性相对低一些。
此外,等级相关中的肯德尔W系数可用于评定多列数据的相关性。
20.简述非参数检验的主要特点
答:
非参数检验相对参数检验不需要严格的前提假设,特别是关于分布正态性假设,所以也称为自由分布检验;特别适用于等级/名义型资料,对这类数据参数方法无法直接检验;特别适用于小样本的探索性/预备研究;其优点是计算简便、直观,易于掌握,检验速度较快;缺点是对资料的信息利用少,方法的效能和完善性都不及参数检验。
(第二部分)
简要回答下面的问题应当用何种统计方法进行分析(不需计算)
1.某研究者欲研究学习动机和学习成绩之间的关系,用动机量表测得学生的学习动机,再用标准化学绩考试测得成绩,两组数据均可视为连续等距数据。
如果学生的成绩是教师的等级评定分,又应如何分析?
答:
两组数据均为连续等距数据,则可以近似地用积差相关求二者相关程度;如果学生的成绩是等级评定,则需要将动机的数据"降格"为等级数据,使用斯皮尔曼等级相关系数公式。
2.为研究职业类型(工人、农民、教师、公务员、商人)对生活满意度(满意、不满意)是否有影响,应选用什么样的统计方法?
答:
要根据研究者取得的数据类型来判断,如果满意感被简单分成了满意和不满意两个对立的类别,而不是某个量表上的连续分数,则两个变量都是名义变量,只能取得计数数据,即各种职业上表示满意的有多少人,不满意的有多少人。
所以这个问题是卡方检验中的独立性检验,独立性检验既可以理解为考察两变量间是否相关,也可以理解为其中一个变量的分类对另一个变量是否有影响。
同时还可以判断这是独立样本的独立性检验,因为不是重测数据。
3.两考生的高考成绩五科如下表,已知所有考生各科成绩的平均数和标准差,如何判断两考生高考成绩哪一个更好?
语文数学英语物理化学
甲生100120115125130
乙生110115120130125
答:
使用Z分数,将两考生的各科成绩按照所有考生成绩的平均数和标准差化成Z分数,然后对Z分数求和,之后再比较大小判断两考生的成绩优劣。
因为只有Z分数才能表示各科成绩的在总体中的相对位置,直接将五科成绩简单相加进行比较就忽略了各科成绩的非同质性。
4.假设某次人事选拔考试分数服从正态分布,平均数和标准差分别为75,10,现欲选出40%高分者录用,问分数线应当定成多少?
答:
考试分数服从正态分布,又牵涉到人数比例,则可以使用Z分数,利用标准正态分布中,Z分数和概率之间的对应关系求解。
具体说就是先根据40%的比例(大分数端)查正态分布表得到对应的Z分数,再利用平均数和标准差还原为原始分数,就是取高分数者40%对应的原始分数线。
5.某校长根据自己的经验预测今年高考全区的平均分为530分,全区随机抽取100名毕业生高考平均成绩为520分,标准差42。
问该校长的预测是否准确?
答:
这实际上是检验考生成绩总体平均数是否和一个已知数--校长的经验预测有显著差异,因此是显著性检验问题,将100名考生视为全区学生的一个样本,因此总体参数未知,用t检验。
由于样本容量很大,也可以近似采用Z检验。
6.某研究者想考查教师教学效能感和教师教学效果之间的数量关系,分别用量表测得两组数据均可视为连续正态数据。
答:
两组数据均可视为正态连续数据,因此可以考虑使用回归分析法建立两变量之间的数量关系式。
7.假设某考生在高考中,语文得110分,数学得125分。
如果所有考生的语文平均分为90,标准差为10;数学平均分为100,标准差为15分。
那么,相对而言这个考生哪方面能力更强?
答:
类似于3题,要比较考生的两科成绩,实际是要看哪科成绩在考生总体中的相对位置或名次更好,因此可以使用Z分数,利用语文和数学成绩总体的均分和标准差将该考生的两门成绩化成Z分数,根据Z分数大小判断。
8.某研究者欲研究学习动机对学习成绩的影响,用动机量表测得学生的学习动机,再用标准化学绩考试测得成绩,按照动机的高低将学生分成高动机者、中等动机者和低动机者。
答:
既然将动机按分数高低分成了高、中、低三个类别,则可以将之视为类别变量,采用单因素方差分析来检验三个类别的动机在学习成绩上有无显著差异。
这比简单地将动机成绩作为连续变量进行动机和成绩间的相关分析要好一些。
9.在缪勒-莱尔错觉实验中,为了研究夹角对错觉量的影响,随机抽取了18名被试,考虑到学生之间的个体差异,每名被试都在15度、45度和60度三种夹角下进行错觉实验现在需要求三种夹角下错觉量差异是否显著用什么方法?
答:
要比较的主要是三种夹角的错觉量差异,因此用方差分析;考虑了夹角和个体差异可能都对错觉两发生影响,因此这是一个随机化区组设计,每个学生就是一个区组,所以用区组设计的方差分析。
10.欲考查两种记忆方法的效果,让一组学生先后用两种方法记忆难度相当但内容不同的陌生材料,一半的学生先用方法A,后用方法B,另一半学生相反,学习后间隔一段时间测量他们的保持量。
答:
从实验设计看,这是个被试内设计,两组学生学习顺序相反只是为了抵消可能的顺序效应。
可以使用相关样本的t检验来考察两组的保持量之间有无显著差异。
差异检验中,判断样本为独立样本还是相关或配对样本除了看样本容量是否相等(样本容量不同通常都是独立样本),还要看是否使用了相同的被试--被试完全相同,则大多为相关样本;被试不同,则也可能为相关样本,例如根据实验处理之外的其他无关变量对被试进行配对。
所以判断的关键是看数据之间是否存在对应关系,若有(不能随意调换数据,只能成对一起调换)则为相关样本,反之则为独立样本。
11.选取8对被试,每对被试年龄、智商和视敏度相当,让其中一名被试参加视觉试验,看一个高亮度背景下的物体,另一个被试看一个低亮度背景下的同样物体。
记录下他们平均反应时,试决定视觉亮度不同是否影响物体识别的反应时。
答:
问题实际上时要比较两种视觉亮度条件下的反应时差异是否显著,如果显著则说明亮度不同对反应时有影响。
虽然两种条件下使用了不同的被试,但这仍然是一个相关样本,因为对被试进行了配对。
可以理解为被试除了实验条件不同外其它方面的性质完全一样,相当于同样的被试。
之所以这样处理而不用被试内设计,是因为让被试重复接受两种条件容易发生视觉的适应,而影响反应时。
所以用相关样本的t检验。
12.16名小学生随机分成4组,每组被试分别解决一种算术问题:
加、减、乘、除,各10道,记录下平均解题时间,问小学生解决四类问题的解题时间有否显著差异。
答:
首先根据自变量有多个水平判断应当使用方差分析,进一步考察实验设计的特点,这是一个完全随机化设计,所以用对应的方差分析法。
13.在一个研究汽车尾灯用什么颜色能最快地引起后面车辆驾驶员反应的实验中,选取了8名被试在红光、绿光和黄光三种情况下均测试他们的反应时,试判断其反应快慢的差异是因为个体差异还是因为不同颜色所致?
答:
自变量是色光颜色,因变量是反应时,要考察的除了不同颜色对反应时的影响,还考虑了一个无关变量--个体差异。
因此,这是一个典型的区组设计,即8名被试各作为一个区组,区组内接受所有处理,即每个被试都接受三个色光处理。
利用随机区组设计方差分析可以考察自变量效应和区组效应,以此判断那个变量对反应时有显著影响或者两变量都有影响。
14.对24名儿童的智商进行了配对,得到3个分组,智力水平分别为高、中、低,每个组的儿童又随机分成两组分别采用两种方法学习解九连环,一种是完全讲授式,教师重复地讲解游戏玩法;另一种是互动式,将试讲完一遍后让儿童自己摸索,学习时间相等。
问两种学习方法的效果有无差异。
答:
一般的区组设计是单个被试,由于是同一个人,所以他不得不接受完所以的实验处理,因此等价于被试内设计或者说重复测量设计;这个问题也是一个区组设计,考虑到智力水平可能影响学习效果,所以先按照智商分组,同一个智力水平组的所有被试(8名)接受完所有处理即两种方法,但实际上是4名被试接受一种方法,4名被试接受另一种方法。
因此它是一个被试间设计,但仍然可以用区组设计的方差分析而不用完全随机化设计方差分析,这样处理可以考察学习方法的效果差异外,还可以考察智商分组对学习效果的影响,分析更精细。
15.欲研究某种药物对于治疗抑郁症的疗效,取两组病情相当的病人,一组施加该药物,另一组按常规疗法治疗,一段时间后再用抑郁量表测量他们的症状。
答:
要比较两个组的症状差异,所以考虑用差异显著性检验。
该实验设计为典型的实验组控制组设计,所以使用独立样本的t检验。
又因为要考察实验组药物的疗效,所以应当使用单侧检验。
16.从某地区的六岁儿童中随机抽取男童30人,测量身高,平均数为114cm,标准差为5cm,抽取女童27人,平均身高为112.5cm,标准差为6.5cm,问该地区六岁男女儿童身高是否有显著差异?
答:
首先判断该问题要比较男、女两组儿童的身高差异,所知的数据均为样本数据,所以应当使用t检验。
而显然两组样本为独立样本,所以使用独立样本t检验。
17.在一项军事训练中,要比较飞行员和导航员的复杂反应时。
以下数据记录的是被试对100次刺激呈现的反应错误次数。
问他们的错误判断是否有显著差异?
SN
飞行员23.510.515
导航员41.312.720
答:
和上题类似,首先判断该问题要比两组不同被试的反应时作业差异,所知的数据均为样本数据,所以应当使用t检验。
而显然两组样本为独立样本,所以使用独立样本t检验。
18.研究表明,具有家族酗酒史的人比没有家族酗酒史的人更容易酒精中毒。
现调查了两组人,分别是有、没有家族酗酒史的被试。
给他们喝酒,然后测量他们的血样,检查酒精代谢物。
结果如下。
问两组被试血样中酒精代谢物含量有否显著差异?
有家族史被试酒精含量3.13.53.22.82.63.01.92.7
无家族史被试酒精含量2.52.11.82.32.21.92.32.5
答:
此类问题的关键是要判断出题目中的条件究竟是些什么,特别要判断研究的设计类型。
该题中并未说明两组被试之间进行了配对,而且确实使用了不同的被试,因此应当使用独立样本的t检验。
但若稍微改变条件--此研究应当考虑到被试间的个体差异,因此理应对被试除来自于不同家庭"背景"(有无酗酒史)之外的其他条件(如是否为第一次饮酒、身体素质等)加以控制保持一致,需要对被试进行配对,此时就应当使用相关样本的t检验。
19.32名初中生,先让他们学习15秒钟单词(共15个),然后随机平均分成两组,其中一组进行自由回忆测验,另一组进行再认测验。
记录下回忆正确单词的数目如下。
问两组被试的回忆成绩有否显著差异?
再认测验正确数量151413121086
人数6142111
自由回忆正确数量4210
人数1573
答:
两种实验条件下使用了不同的被试,因此要比较回忆成绩的差异,应当使用独立样本t检验。
20.调查两种统计课教学方法的效果,50名学生被随机平均分配到两个组中,一组由教师实施传统课堂教授教学,另一组由同一教师引导学生进行群体讨论。
最后用统一的期末标准化考试题测量学生成绩。
数据如下,问两种教学方法的效果有否显著差异?
SNSN
讲授81.78.325讨论74.110.125
答:
同上题,两种实验条件下使用了不同的被试,因此要比较两种教学方法的差异,应当使用独立样本t检验。
二、计算题
1.某研究者欲研究光线亮度对颜色识别的影响,随机选取了28名被试分成4组,每组被试进行12次测试,要求他们在两种颜色的物体中判断哪一个色彩的饱和度(客观指标)更高,4个组的实验条件分别是四种不同的亮度环境:
正常、稍微昏暗、比较暗、非常暗。
记录下12次测试中的正确判断次数,数据如下表。
试进行方差分析。
正常照明91287587
有点暗2839427
比较暗4325322
非常暗2010121
答:
这是一个典型的完全随机化设计,假设检验步骤省略(下同,正式考试时千万不能省略!
!
),方差分析表如下:
变异源平方和自由度均方F值
组间187.25362.4216.28
组内92243.83
总279.2527
查表得F>F0.01(3,24)=4.72,所以不同照明条件对色彩识别的效果差异显著。
2.一项实验检验练习对走迷宫任务作业中错误次数的影响,9名被试参加了实验。
先让他们进行作业测试,之后给他们10分钟练习时间,在进行同样的测试,练习前后的错误次数如下表所示,问练习后的作业成绩是否显著地优于练习前?
被试号123456789
练习前错误次数871365118910
练习后错误次数428466456
答:
由于是对同样的被试测试了两次,因此可以理解为问题是比较无练习和有练习情况下技能作业成绩的差异,采用相关样本的t检验。
又因为问题是练习后是否显著优于练习前,因此其研究假设是:
μ后<μ前(错误次数越少,成绩越优)。
所以应该用单侧检验。
t=5.49,查表的t>t0.05(8)=1.86
所以练习后的成绩显著地优于练习前成绩,错误次数练习后明显减少。
3.一项研究考察长跑运动员肺活量的增加如何依赖于每月锻炼时数,测得7名运动员的数据如表所示,试求肺活量与锻炼时数之间的数量关系,并进行显著性检验。
每月锻炼时数405060708090100
肺活量增量500600600800750750900
答:
只有两个变量,因此是一元线性回归,使用最小二乘法推导来的公式求解回归方程中的a、b。
,解得b=5.893,a=287.5,方程为:
=5.893X+287.5。
在对方程显著性进行检验,由于是一元方程,所以用t检验或方差分析都可以,这里采用方差分析计算较简单,步骤可省略。
方差分析表如下:
变异源平方和自由度均方F值