14.以下易受极端数据影响的统计量是〔〕。
A.算术平均数B.中数C.众数D.四分差
15.“75~〞表示某次数分布表中某一分组区间,其组距为5,那么该组的组中值是〔〕。
A.77B.76.5C.77.5D.76
参考答案:
1.B2.D3.A4.D5.B6.D7.C8.B
9.D10.B11.C12.A13.B14.A15.A
二、多项选择题
1.下面属于集中量数的有〔〕。
A.算术平均数B.中数C.众数D.几何平均数
2.平均数的优点:
(〕。
A.反响灵敏B.不受极端数据的影响
C.较少受抽样变动的影响D.计算严密
3.中数的优点:
(〕。
A.简明易懂B.计算简单C.反响灵敏D.适合进一步作代数运算
4.众数的缺点〔〕。
A.概念简单,容易理解B.易爱分组影响,易爱样本变动影响
C.不能进一步作代数运算D.反响不够灵敏
参考答案:
1.ABCD2.ACD3.AB4.BCD
三、简答题
1.简述算术平均数的使用特点〔浙大2003研,苏州大学2002研〕
答:
算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。
计算公式:
式中,N为数据个数;Xi为每一个数据;∑为相加求和。
(l〕算术平均数的优点是:
①反响灵敏;②严密确定,简明易懂,计算方便;③适合代数运算;④受抽样变动的影响较小。
(2〕除此之外,算术平均数还有几个特殊的优点:
①只知一组观察值的总和及总频数就可以求出算术平均数。
②用加权法可以求出几个平均数的总平均数。
③用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。
④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
(3〕算术平均数的缺点:
①易受两极端数值〔极大或极小〕的影响。
②一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
2.算术平均数和几何平均数分别适用于什么情形?
〔南开大学2004研〕
答:
(l〕算术平均数
1算术平均数的概念
算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。
②算术平均数的优点
a.一般优点
第一,反响灵敏;第二,严密确定,简明易懂,计算方便;第三,适合代数运算;第四,受抽样变动的影响较小。
b.特殊优点第一,只知一组观察值的总和及总频数就可以求出算术平均数;第二,用加权法可以求出几个平均数的总平均数;第三,用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值;第四,在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
③缺点a.易受两极端数值〔极大或极小〕的影响;b.一组数据中某个数值的大小不够确切时就无法计算其算术平均数;
④适用情况
第一,数据必须是同质的,即同一种测量工具所测量的某一特质;
第二,数据取值必须明确;
第三,数据离散不能太大。
(2〕几何平均数
1几何平均数的概念
几何平均数是指一种由n个正数之乘积的n次根表示的平均数。
在计算学校经费的增加率、平均率,学生人学率,毕业生的增加率时常用。
2应用
第一,求学习、记忆的平均进步率;
第二,求学校经费平均增加率,学生平均人学率、平均增加率,平均人口出生率。
第四章差异量数
一、单项选择题
1.欲比拟同一团体不同观测值的离散程度,最适宜的指标是〔〕。
A.全距B.方差C.四分位距D.变异系数
2.在比拟两组平均数相差较大的数据的分散程度时,宜用〔〕。
A.全距B.四分差C.离中系数D.标准差
3.平均数μ=4,当X=6.4时,其相应的标准分数为〔〕。
A.2.4B.2.0C.5.2
4.求数据16,18,20,22,17的平均差〔〕。
A.18.6B.1.92C.2.41D.5
5.测得某班学生的物理成绩〔平均78分〕和英语成绩〔平均70分〕,假设要比拟两者的离中趋势,应计算〔〕。
A.方差B.标准差C.四分差D.差异系数
6.某学生某次数学测验的标准分为2.58,这说明全班同学中成绩在他以下的人数百分比是〔),如果是-2.58,那么全班同学中成绩在他以上的人数百分比是〔〕。
A.99%,99%B.99%,l%C.95%,99%D.95%,95%
7.一组数据6,5,7,4,6,8的标准差是1.29,把这组中的每一个数据都加上5,然后再乘以2,那么得到的新数据组的标准差是〔〕。
A.1.29B.6.29C.2.58D.12.58
8.标准分数是以〔〕为单位表示一个分数在团体中所处位置的相对位置量数。
A.方差B.标准差C.百分位差D.平均差
9.在一组原始数据中,各个Z分数的标准差为〔〕。
A.1B.0C.根据具体数据而定D.无法确定
10.某小学一年级学生的平均体重为26kg,体重的标准差是3.2kg,平均身高110cm,标准差为6.0cm,问体重与身高的离散程度哪个大〔)?
A.体重离散程度大B.身高离散程度大C.离散程度一样D.无法比拟
11.一组数据服从正态分布,平均数为80,标准差为10。
Z值为-1.96的原始数据是〔〕。
A.99.6B.81.96C.60.4D.78.04
12.某次英语考试的标准差为5.1分,考虑到这次考试的题目太难,评分时给每位应试者都加了10分,加分后成绩的标准差是〔〕。
A.10B.15.1C.4.9D.5.1
13.某城市调查8岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数〔〕。
A.单位是厘米B.单位是米C.单位是平方厘米D.无单位
参考答案:
1.D2.D3.B4.B5.D6.A7.C8.B9.A
10.A11.C12.D13.D
二、多项选择题
1.平均差的优点〔〕。
A.平均差意义明确,计算容易B.较好的代表了数据分布的离散程度
C.反响灵敏D.有利于进一步做统计分析
2.常见的差异量数有〔〕。
A.平均差B.方差C.百分位数D.几何平均数
3.标准分数的优点〔〕。
A.可比性B.可加性C.明确性D.稳定性
参考答案:
1.ABC2.ABC3.ABCD
三、概念题
1.差异系数〔浙大2003研〕
答:
差异系数〔coefficientofvariation),又称变异系数、相对标准差等,它是一种相对差异量,用CV来表示,为标准差与平均数的百分比。
在对不同样本的观测结果的离散程度进行比拟时,常常遇到下述情况:
两个或多个样本所测的特质不同。
如何比拟其离散程度?
即使使用的是同一种观测工具,但样本的水平相差较大时,如何比拟它们的离散程度?
这时需要运用相对差异量进行比拟。
差异系数的计算公式是:
〔S为某样本的标准差,M为该样本的平均数〕。
差异系数在心理与教育研究中常常应用于同一对象的不同领域或同一领域的不同对象。
2.四分差〔中科院2004研〕
答:
四分差又称四分位差,是差异量数的一种。
计算公式:
。
Q3:
第三个四分位数,Q1:
第一个四分位数。
在次数分配上第一个四分位数与第三个四分位数之间包含着全体项数的一半。
次数分配越集中,离中趋势越小,那么这二者的距离也越小。
根据这两个四分位数的关系,观测次数分配的离散程度也可以得到相当高的准确性。
因此,四分差可以说明某系列数据中间局部的离散程度,并可防止两极端值的影响。
四分差通常与中数联系起来共同应用,不适合进一步代数运算,反响不够灵敏。
3.集中量数与差异量数〔浙大2000研,苏州大学2002研〕
答:
集中量数与差异量数都是描述一组数据特征的统计量。
集中量数是表现数据集中性质或集中程度的统计量,数据的集中情况指一组数据的中心位置;集中趋势的度量即确定一组数据的代表值,描述集中情况的度量包括:
算术平均数、中位数、众数、几何平均数、调和平均数和加权平均数等。
差异量数是表现数据分散性质或分散程度的统计量,数据的差异性即为离中趋势;常见的差异量数有标准差或方差、全距、平均差、四分差和各种百分差等。
4.T分数〔华中师大2004研〕
答:
T分数指由正态分布上的标准分数转换而来的等距量表分数。
T分数以50为平均数,以10为标准差。
T=50+10z。
T分数是z分数的变形,因为z分数有负值和小数,人们不习惯,所以采用这个公式处理。
经过变换,所得的分数全是整数,50分为普通,50分以上越高越好,50分以下越低越差。
T分数的意义及其优点和标准分数相同,不同之处是消除了小数和分数。
5.标准分数〔华中师大2006研〕
答:
标准分数指以标准差为单位的一种差异量数,又称Z分数或基分数。
它等于一数列中各原始分数与其平均数的差,再除以标准差所得的商,公式为:
,式中,Z为某原始数据的标准分数,Xi为原始数据的值,
为该组数据的平均数,S为该组数据的标准差。
标准分数的平均数为0,标准差为1。
标准分数是一种不受原始测量单位影响的数值,用来表示一个原始分数在团体中所处位置的相对位置量数。
其作用除了能够说明原数据在其分布中的位置外,还能对未来不能直接比拟的各种不同单位的数据进行比拟。
如比拟各个学生的成绩在班级成绩中的位置或比拟某个学生在两种或多种测验中所得分数的优劣。
四、计算题
1.计算未分组数据:
18,18,20,21,19,25,24,27,22,25,26的平均数、中位数和标准差。
〔首师大2003研〕
2.把以下分数转换成标准分数。
11.0,11.3,10.0,9.0,11.5,12.2,13.1,9.7,10.5〔华南师大2003研〕
第五章相关系数
一、单项选择题
1.现有8名面试官对25名求职者的面试过程做等级评定,为了解这8位面试官的评价一致性程度,最适宜的统计方法是求〔〕。
A.spearman相关系数B.积差相关系数
C.肯德尔和谐系数D.点二列相关系数
2.以下哪个相关系数所反映的相关程度最大〔〕。
A.r=+B.r=-0.69C.r=+0.37
3.AB两变量线性相关,变量A为符合正态分布的等距变量,变量B也符合正态分布且被人为划分为两个类别,计算它们的相关系数应采用〔〕。
A.积差相关系数B.点双列相关
C.二列相关D.肯德尔和谐系数
4.假设两变量线性相关,两变量是等距或等比的数据,但不呈正态分布,计算它们的相关系数时应选用〔〕。
A.积差相关B.斯皮尔曼等级相关
C.二列相关D.点二列相关
5.假设两变量为线性关系,这两变量为等距或等比的数据且均为正态分布,计算它们的相关系数时应选用〔〕。
A.积差相关B.斯皮尔曼等级相关C.二列相关D.点二列相关
6.r=-0.50的两变量与r=+0.50的两变量之间的关系程度〔〕。
A.前者比后者更密切B.后者比前者更密切C.相同D.不确定
7.相关系数的取值范围是〔〕。
A.
<1B.
≥0C.
≤1D.0<
<1
8.确定变量之间是否存在相关关系及关系紧密程度的简单而又直观的方法是〔〕。
A.直方图B.圆形图C.线性图D.散点图
9.积差相关是英国统计学家〔〕于20世纪初提出的一种计算相关的方法。
A.斯皮尔曼B.皮尔逊C.高斯D.高尔顿
10.同一组学生的数学成绩与语文成绩的关系为〔〕。
A.因果关系B.共变关系C.函数关系D.相关关系
11.假设两变量线性相关,一变量为正态、等距变量,另一变量为二分名义变量,计算它们的相关系数时应选用〔〕。
A.积差相关B.二列相关C.斯皮尔曼等级相关D.点二列相关
12.斯皮尔曼等级相关适用于两列具有〔〕的测量数据,或总体为非正态的等距、等比数据。
A.类别B.等级顺序C.属性D.等距
13.在统计学上,相关系数r=0,表示两个变量之间〔〕。
A.零相关B.正相关C.负相关D.无相关
14.如果相互关联的两变量,一个增大另一个也增大,一个减小另一个也减小,变化方向一致,这叫做两变量之间有〔〕。
A.负相关B.正相关C.完全相关D.零相关
15.有10名学生参加视反响时和听反响时的两项测试,经过数据的整理