现代心理与教育统计学课后题完整版78975.docx
《现代心理与教育统计学课后题完整版78975.docx》由会员分享,可在线阅读,更多相关《现代心理与教育统计学课后题完整版78975.docx(38页珍藏版)》请在冰点文库上搜索。
现代心理与教育统计学课后题完整版78975
第一章绪论
1.名词解释随机变量:
在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:
又称为母全体、全域,指据有某种特征的一类事物的全体样本:
从总体中抽取的一部分个体,称为总体的一个样本个体:
构成总体的每个基本单元称为个体次数:
指某一事件在某一类别中出现的数目,又成为频数,用f表示频率:
又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
频率通畅用比例或百分数表示概率:
又称机率。
或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率
统计量:
样本的特征值叫做统计量,又叫做特征值
参数:
总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:
在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据
2.何谓心理与教育统计学?
学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。
整理。
分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3.选用统计方法有哪几个步骤?
首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件
4.什么叫随机变量?
心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:
①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量
5.怎样理解总体、样本与个体?
总体N:
据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。
特点:
①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定
样本n:
从总体中抽取的一部分交个体,称为总体的一个样本。
样本数目用n表示,又
叫样本容量。
特点:
①样本容量越大,对总体的代表性越强②样本不同,统计方法不
同
总体与样本可以相互转化。
个体:
构成总体的每个基本单元称为个体。
有时个体又叫做一个随机事件或样本点
6.何谓次数、频率及概率
次数f:
随机事件在某一类别中出现的数目,又称为频数,用f表示
频率:
即相对次数,即某个事件次数被总事件除,用比例、百分数表示
概率P:
又称机率或然率,用P表示,指某事件在无限管侧重所能预料的相对出现次数。
估计值(后验):
几次观测中出现m次,P(A)=m/n
真实值(先验):
特殊情况下,直接计算的比值(结果有限,出现可能性相等)
7.统计量与参数之间有何区别和关系?
参数:
总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标
统计量:
样本的特征值叫做统计量,又称特征值
二者关系:
参数是一个常数,统计量随样本而变化
参数常用希腊字母表示,统计量用英文字母表示
当试验次数=总体大小时,二者为同一指标
当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值
8.试举例说明各种数据类型之间的区别?
9.下述一些数据,哪些是测量数据?
哪些是计数数据?
其数值意味着什么?
17.0千克89.85厘米199.2秒93.5分是测量数据
17人25本是计数数据
10.说明下面符号代表的意义
□反映总体集中情况的统计指标,即总体平均数或期望值
X反映样本平均数
P表示某一事物两个特性总体之间关系的统计指标,相关系数
r样本相关系数
b反映总体分散情况的统计指标标准差
s样本标准差
B表示两个特性中体之间数量关系的回归系数
N
n
第二章统计图表
1.统计分组应注意哪些问题?
1分类要正确,以被研究对象的本质为基础
2分类标志要明确,要包括所有数据
3如删除过失所造成的变异数据,要遵循3b原则
2.直条图适合哪种资料?
条形图也叫做直条图,主要用于表示离散型数据资料,即计数资料。
3.圆形图适合哪种资料
又称饼图,主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较,显示的资料多以相对数(如百分数)为主
4.将下列的反应时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形。
177.5
167.4
116.7
130.9
199.1
198.3
225.0
212.0
180.0
171.0
144.0
138.0
191.0
171.5
147.0
172.0
195.5
190.0
206.7
153.2
217.0
179.2
242.2
212.8
171.0
241.0
176.5
165.4
201.0
145.5
163.0
178.0
162.0
188.1
176.5
172.2
215.0
177.9
180.5
193.0190.5167.3170.5189.5180.1217.0186.3180.0182.5171.0147.0160.5
最大值242.2最小值116.7全距为125.5
N=65代入公式K=1.87(N-1)2/5=9.8所以K取10
定组距13最低组的下限取115
表2-1次数分布表
分组区间
组中值(Xc)
次数(f)
频率(P)
百分次数(%
232~
238
2
0.03
3
219~
225
1
0.02
2
206~
212
6
0.09
9
193~
199
6
0.09
9
180~
186
14
0.22
22
167~
173
16
0.25
25
154~
160
5
0.08
8
141~
147
11
0.17
17
128~
134
3
0.05
5
115~
121
1
0.02
2
合计
65
1.00
100
表2-2
累加次数分布表
分组区-
次数
向上累加次数
向下累加次数
牧(f)
相对累加次
实际累加次数
相对累加次
间
实际累加次数(cf)
数
(cf)
数
232~
2
65
1.00
2
0.03
219~
1
63
0.97
3
0.05
206~
6
62
0.95
9
0.14
193~
6
56
0.86
15
0.23
180~
14
50
0.77
29
0.45
167~
16
36
0.55
45
0.69
154~
5
20
0.31
50
0.77
141~
11
15
0.23
61
0.94
128~
3
4
0.06
64
0.98
115~
1
1
0.02
65
1.00
7.下面是一项美国高中生打工方式的调查结果。
根据这些数据用手工方式和计算方式个制
作一个条形图。
并通过自己的体会说明两种制图方式的差别和优缺点
打工方式
高二(%
高三(%
看护孩子
26.0
5.0
商店销售
7.5
22.0
餐饮服务
11.5
17.5
其他零工
8.0
1.5
■高二
■高三
左侧Y轴名称为:
打工人数百分比
下侧X轴名称为:
打工方式
第三章集中量数
1.应用算术平均数表示集中趋势要注意什么问题?
应用算术平均数必须遵循以下几个原则:
1同质性原则。
数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。
2平均数与个体数据相结合的原则
3平均数与标准差、方差相结合原则
2.中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?
中数适用于:
①当一组观测结果中出现两个极端数目时②次数分布表两端数据或个别数据不清楚时③要快速估计一组数据代表值时
众数适用于:
①要快速且粗略的求一组数据代表值时②数据不同质时,表示典型情况
③次数分布中有两极端的数目时④粗略估计次数分布的形态时,用M-Mo作为表示次
数分布是否偏态的指标(正态:
M=Md=Mo;正偏:
M>Md>Mo;负偏:
M⑤当次数分布中出现双众数时
几何平均数适用于①少数数据偏大或偏小,数据的分布成偏态②等距、等比量表实验
③平均增长率,按一定比例变化时
调和平均数适用于①工作量固定,记录各被试完成相同工作所用时间②学习时间一定,
记录一定时间内各被试完成的工作量
3.对于下列数据,使用何种集中量数表示集中趋势其代表性更好?
并计算它们的值。
⑴4566729中数=6
⑵345575众数=5
⑶2356789平均数=5.71
4.求下列次数分布的平均数、中数。
分组
f
分组
f
65~
1
35~
34
60~
4
30~
21
55~
6
25~
16
50~
8
20~
11
45~
16
15~
9
40~
24
10~
7
解:
组中值由“精确上下限”算得;设估计平均值在35~组,即AM=37;中数所在组为35~,
fMD=34,其精确下限Lb=34.5,该组以下各组次数累加为Fb=21+16+11+9+7=64
分组
f
组中值
d=(Xi-AM)/i
fd
65~
1
67
6
6
60~
4
62
5
20
55~
6
57
4
24
50~
8
52
3
24
45~
16
47
2
32
40~
24
42
1
24
35~
34
37
0
0
30~
21
32
-1
-21
25~
16
27
-2
-32
20~
11
22
-3
-33
15~
9
17
-4
-36
10~
7
12
-5
-35
刀N=157
刀fd=-27
-fd
XAM+-
N
3727536.14
157
5.求下列四个年级的总平均成绩。
年级
一二三四
x
90.5919294
n
236318215200
EXi
解:
Xt--
90.5236913189221594200
91.72
236318215200
6.三个不同被试对某词的联想速度如下表,求平均联想速度
被试
联想词数时间(分)词数/分(Xi)
A
B
C
13213/2
13313/3
1325-
解:
C被试联想时间
25分钟为异常数据,删除
调和平均数Mh
1152
111/23、
NXi2(1313)
7.下面是某校几年来毕业生的人数,问平均增加率是多少?
并估计多少。
10年后的毕业人数有
年份
1978
1979
1980
1981
1982
1983
1984
1985
毕业人数
542
601
750
760
810
930
1050
1120
解:
用几何平均数变式计算:
10年后毕业人数为1120X1.10925°=3159人
8.计算第二章习题4中次数分布表资料的平均数、中数及原始数据的平局数。
解:
组中值由“精确上下限”算得;设估计平均值在167~组,即设AM=173;中数所在组
为167~,fMD=16,其精确下限Lb=166.5,该组以下各组次数累加为Fb=1+3+11+5=20
分组区间
组中值(Xc)
次数(f)
d=(Xi-AM)/i
fd
232~
238
2
5
10
219~
225
1
4
4
206~
212
6
3
18
193~
199
6
2
12
180~
186
14
1
14
167~
173
16
0
0
154~
160
5
-1
-5
141~
147
11
-2
-22
128~
134
3
-3
-9
115~
121
1
-4
-4
合计
刀N=65
刀fd=18
平均值XAM+
fd18
i=173+13176.6
N65
中数Md二Lb+
65
2
原始数据的平均数=176.8
第四章差异量数
1.度量离中趋势的差异量数有哪些?
为什么要度量离中趋势?
度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。
在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。
这些特殊性常表现为数据的变异性。
如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。
因此只有集中量数不可能真实的反映出样本的分布情况。
为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。
2.各种差异量数各有什么特点?
见课本103页“各种差异量数优缺点比较”
3.标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?
可以计算差异系数(应用)和标准分数(应用)
4.应用标准分数求不同质的数据总和时应注意什么问题?
要求不同质的数据的次数分布为正态
5.计算下列数据的标准差与平均差
11.013.010.09.011.512.213.19.710.5
Xi11.013.010.09.011.512.213.19.710.5一,
11.1
N9
Xi-X
A.D.=
n
6.计算第二章习题4所列次数分布表的标准差、四分差Q设估计平均值在167~组,即AM=173,i=13
分组区间
Xc
f
d=(Xc-AM)/i
fd
fd2
232~
238
2
5
10
50
219~
225
1
4
4
16
206~
212
6
3
18
54
193~
199
6
2
12
24
180~
186
14
1
14
14
167~
173
16
0
0
0
154~
160
5
-1
-5
5
141~
147
11
-2
-22
44
128~
134
3
-3
-9
27
115~
121
1
-4
-4
16
合计
65
18
250
N=6565X25%=16.2565X75%=48.75所以Q1、Q3分别在154~组(小于其组精确下
限的各组次数和为15)和180~组(小于其组精确下限的各组次数和为36),其精确下限分
别为153.5和179.5,所以有:
1
1
N-Fb1
6515
Q1Lb1
i=153.5+4-
13=156.75
f1
5
Q3
Q^^1=191-34-156-75=17.30
22
7.今有一画线实验,标准线分别为5cm和10cm,实验结果5cm组的误差平均数为1.3cm,标准差为0.7cm,10cm组的误差平均数为4.3cm,标准差为1.2cm,请问用什么方法比较
其离散程度的大小?
并具体比较之。
用差异系数来比较离散程度。
CV1=(s1/X1)x100%=(0.7/1.3)X100%=53.85%
CV2=(s2/X2)X100%=(1.2/4.3)X100%=27.91%所以标准线为5cm的离散程度大。
8.求下表所列各班成绩的总标准差
班级
平均数
标准差
人数
di
1
90.5
6.2
40
0.3
2
91.0
6.5
51
-0.2
3
92.0
5.8
48
-1.2
4
89.5
5.2
43
1.3
M40514843182
Xt亠:
90.54091.0519204889・543竺空90.80M182182
diXtXi其值见上表
Ng406.22516.H485.82435.226469.79
Nidi2400.3251(0.2)248(1.2)2431.32147.43
6.03
设估计平均数AM=52,即在50~组,d=(Xc-AM)/I计算各值如下表所示:
22
分组fXc累加次数ddfdfd
75~8017755525255
70~
2
72
54
4
16
32
8
65~
4
67
52
3
9
36
12
60~
5
62
48
2
4
20
10
55~
8
57
43
1
1
8
8
50~
10
52
35
0
0
0
0
45~
9
47
25
-1
1
9
-9
40~
7
42
16
-2
4
28
-14
35~
4
37
9
-3
9
36
-12
30~
2
32
5
-4
16
32
-8
25~
2
27
3
-5
25
50
-10
20~
1
22
1
-6
36
36
-6
合计
55
312
-16
/fd2
fd2
'312
16o
s=
(
)2
i=,
()511.82
VN
N
55
55
55X25%=13.75
55X75%=41.25
所以Q1在40~组,
其精确下限
Lb1=39.5,
小于其组的次
数为Fb1=9,
其组次数
f1=7;Q2在
55~组,其精确下限
Lb2=54.5,
小于其组的次数为
Fb2=35,
1
1
N-Fb1
559
L4
b1
i=39.5+4-
5=42.89
f1
7
其组次数f2=8。
计算Q1、Q2如下:
第五章相关关系
1.解释相关系数时应注意什么?
(1)相关系数是两列变量之间相关成都的数字表现形式,相关程度指标有统计特征数r和总体系数P
(2)它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r大比r小相关
密切,不能说r大=0.8是r小=0.4的两倍(不能用倍数关系来解释)
(3)当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值
(4)-1(5)相关系数大的事物间不一定有因果关系
(6)当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象
2个个体计算
(7)计算相关要成对数据,即每个个体有两个观测值,不能随便
(8)非线性相关的用r得可能性小,但并不能说不密切
2.假设两变量为线性关系,计算下列各情况的相关时,应用什么方法?
(1)两列变量是等距或等比的数据且均为正态分布(积差相关)
(2)两列变量是等距或等比的数据且不为正态分布(等级相关)
(3)一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类(二列相关)
(4)一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类(多列相关)
(5)一变量为正态等距变量,另一列变量为二分称名变量(点二列相关)
(6)两变量均以等级表示(等级相关、交错系数、相容系数)
3.如何区分点二列相关与二列相关?
主要区别在于二分变量是否为正态。
二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在对应关系。
4.品质相关有哪几种?
各种品质相关的应用条件是什么?
品质相关分析的总条件是两因素多项分类之间的关联程度,分为一下几类:
(1)四分相关,应用条件是:
两因素都为正态连续变量(eg学习能力,身体状态))
人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况
(2)①系数:
除四分相关外的2X2表(最常用)
(3)列联表相关C:
RXC表的计数资料分析相关程度
5.预考查甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?
等级相关
6.下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当?
被试
A
B
A2
e2
AB
Ra
Rb
RaRb
D=Ra-Rb
D2
1
86
83
7396
6889
7138
2
3
6
-1
1
2
58
52
3364
2704
3016
7
8
56
-1
1
3
79
89
6241
7921
7031
4
1
4
3
9
4
64
78
4096
6084
4992
6
4
24
2
4
5
91
85
8281
7225
7735
1
2
2
-1
1
6
48
68
2304
4624
3264
9
6
54
3
9
7
55
47
3025
2209
2585
8
9
72
-1
1
8
82
76
6724
5776
6232
3
5
15
-2
4
9
32
25
1024
625
800
10
10
100
0
0
10755656253136420057
E670―659—48080—47193—46993—55—5536834
NXYXY1046993670659
r=
-N
X2(X)2?
NY2(
j0.82
Y)21048080670210471936592
6