《心理统计学》重要知识点062613.docx

资源描述

《心理统计学》重要知识点062613.docx

《《心理统计学》重要知识点062613.docx》由会员分享，可在线阅读，更多相关《《心理统计学》重要知识点062613.docx（23页珍藏版）》请在冰点文库上搜索。

《心理统计学》重要知识点062613.docx

《心理统计学》重要知识点062613

《心理统计学》重要知识点

第二章统计图表

简单次数分布表的编制：

Excel数据透视表

列联表（交叉表）：

两个类别变量或等级变量的交叉次数分布，Excel数据透视表

直方图（histogram）:

直观描述连续变量分组次数分布情况，可用Excel图表向导的柱形图来绘制

散点图（Scatterplot）:

主要用于直观描述两个连续性变量的关系状况和变化趋向。

条形图（Barchart）:

用于直观描述称名数据、类别数据、等级数据的次数分布情况。

简单条形图：

用于描述一个样组的类别（或等级）数据变量次数分布。

复式条形图：

用于描述和比较两个或多个样组的类别（或等级）数据的次数分布。

圆形图（circlegraph）、饼图（piegraph）：

用于直观描述类别数据或等级数据的分布情况。

线形图（linegraph）：

用于直观描述不同时期的发展成就的变化趋势；

第三章集中量数

集中趋势和离中趋势是数据分布的两个基本特征。

集中趋势：

就是数据分布中大量数据向某个数据点集中的趋势。

集中量数：

描述数据分布集中趋势的统计量数。

离中趋势：

是指数据分布中数据分散的程度。

差异量数：

描述数据分布离中趋势（离散程度）的统计量数

常用的集中量数有：

算术平均数、众数（Mo）、中位数（Md）

1算术平均数（简称平均数，M、X、Y）：

X-Excel统计函数AVERAGE

算术平均数的重要特性：

（1）一组数据的离均差（离差）总和为0，即7（x.-x）=0

（2）如果变量X的平均数为X，将变量X按照公式|y二abx转换为Y变量后，

那么，变量Y的平均数Y=aFX

2.中位数（median,Md）：

在一组有序排列的数据中，处于中间位置的数值。

中位数上下的数据出现次数各占50%。

众数（mode,Mo）：

一组数据中出现次数最多的数据。

6.调和平均数（harmonicmean,Mh）:

一组数值倒数的平均数的倒数。

（1）用于描述同一个体（或一组个体）不同时间段的平均学习速度、平均工作效率。

（2）用于描述不同能力水平个体的平均学习速度、平均工作效率。

（1）一组数据中少部分偏大数据的集中趋势。

（或偏小），数据分布呈偏态时，几何平均数比算术平均数更能反映

7.几何平均数（geometricmean,Mg）是指n个观察值连乘积的n次方根

Excel统计函数GEOMEAN

（2）用于计算平均学习进步速度、平均发展速度（平均发展倍数），即环比的几何平均数。

Mg=・』仝x冬X乞…X（X1>x2、…、xn为各个时间段的成果数据）

平均增长率：

X2X3Xn二，X1

Mg-1

第四章差异量数

差异量数：

描述一组数据离散程度（离中趋势）的统计量数。

差异量数较大，说明数据分布得比较分散，数据之间的差异较大；差异量数较小，说明数据分布的比较集中，数据间的差异较小。

差异量数还能反映平均数对一组数据的代表性。

差异量数越小，平均数的代表性越好；差异量数越大，平均数的代表性越差。

常用的差异量数是标准差、方差、差异系数

差异系数（又称变异系数、离散系数、相对标准差）：

CV=鱼

（1）用于比较不同观测工具测量结果（数据单位不同）的离散程度，例如，身高离散程度大，还是体重离散程度大？

（2）用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。

例如：

7岁组

儿童和13组岁儿童的体重离散程度，哪个较大？

标准差的重要特性：

如果变量X的标准差为Sx,将变量X按照公式|y=a•bx转换为Y变量后，那么，变量Y的标准差SY=bSx

相对位置量数：

反映个体（数据）在团体中相对位置的统计量数。

主要有标准分数及其线性转换分数（Z分数、T分数）、百分等级（PR）、正态化标准分数等。

Xi-XXi-k

1•标准分数的计算与应用：

Z-或：

Z亠

T=10Z50,CEEB=100Z500

Z分数的特点：

Z分数的平均数为0，即JZ=0，标准差为1，即匚Z=1

T分数的平均数7=50，标准差为6=10

CEEB分数的平均数=?

，标准差=?

（1）可用于比较个体各方面水平高低（横向比较，个体内差异评价）。

（2）对被试多方面的测量结果进行综合，如对高考各科成绩的综合，各分测验分数的综合。

（3）可用于对个体或样组某方面水平进行前后比较（纵向比较），判断其水平是提高了，退步了，还是没有变化。

•原始分数X的百分等级的含义与计算

第五章相关关系

相关系数：

描述两个变量相关关系的统计量数，在-1.00~1.00之间取值，绝对值越大，越接近1,

说明两个变量之间的关系程度越密切；绝对值越小，越接近0，说明两个变量的关系程度越低。

常用的相关系数：

1.积差相关：

r=（Xi~X）（Yi~y）Excel统计函数CORREL

nSxSy

适用条件：

（1）X、Y两个变量都是连续性变量（等距数据或比率数据）；

（2）X、Y两个变量总体上为正态分布或接近正态分布。

2•斯皮尔曼等级相关：

是一对（两列）名次变量的积差相关。

对数据变量的分布形态没有要求。

（1）等级积差相关法（名次积差相关法）。

.（RX_Rx）（ry_Ry）Excel统计函数CORREL

RNSrxSry

公式中的Rx和Ry是分别代表两变量中每个数据在变量中的名次。

（2）等级差数法（名次差数法）

如果每个等级（即名次）变量中没有相同的等级名次，可用下面公式计算:

如果等级（即名次）变量中有相同的等级名次，需用下面校正公式计算:

等级差数法校正公式：

222

TxTyD——2—2

Sc-—二，Yx、龙y计算方法参见教材125页

3•肯德尔W系数（肯德尔和谐系数）：

描述多个名次变量一致性程度的统计量数。

适用于描述和分析不同评价者（如主考、阅卷者）对同一组个体（考生或答卷）评价结果（名

次）的一致性程度，在心理测量与教育评价中称为评分信度。

例如，5位阅卷老师对10篇论文评分

排名的一致性。

如果评价者给出的不是个体的水平名次，而是分数（或等第、符号），可先将其转换

成名次，然后再计算W系数。

、R2丿R）22

123

捫（n3_n）

校正公式：

WN、t「卫

12312

K2（N3-N）-'T

公式中：

n为每个名次变量中相同名次的数目。

4.点二歹U相关（point-biserialcorrelation）:

用于描述一列续性变量和一列真正二分变量（或非正态二分变量）之间的相关。

真正二变量：

指按某种性质或标准将个体划分为两种结果的变量，如对、错，男、女等。

Xp-Xq

rpbpqExcel统计函数CORREL

二列相关（biserialcorrelation）：

用于描述由一个正态连续变量人为划分成的二分变量与另外一个正态连续变量之间的相关。

或者说，用于描述一正态二分变量与一正态连续变量之间的相关。

及格，80分以上和80分以下；按中考（或高考）成绩，将考生区分为录取、未录取。

正态二分变量？

如果二分变量是根据正态连续变量转换而来，那么，可称之为正态二分变量。

Xp—Xqpq

rb:

sty

y为将正态分布面积画分为p、q两部分的纵线的高度。

y的计算方法：

利用Excel统计函数计算

标准正态分布区间点函数NORMSINV（p值）t区间点Z值

正态分布函数NORMDIST（区间点Z值,0,1,0）F值的概率密度y

6.①相关（①系数）

|ad—bc|

「：

.：

•：

寸（a+b）（c+d）（a+c）（b+d）

用于描述两个真正二分变量的相关程度，也用于描述一个人为二分变量和真正二分变量的相关。

注意：

①相关计算公式是由皮尔逊积差相关计算公式转换来的。

因此，如果两列二分变量转换

为0、1（或1、2）的数值变量时，可以用Excel统计函数CORREL计算①系数。

第六章概率分布

1正态分布的特征（见教材）

2.Excel软件中正态分布函数和正态分布区间点函数的应用

♦标准正态分布函数NORMSDIST的应用：

（1）P（ZV1.96）=?

=NORMSDIST（1.96）=0.9750

（2）P（Z>1.96）=?

=1-NORMSDIST（1.96）=0.0250

（3）P（-1.5VXV2.5）=?

=NORMSDIST（2.5）-NORMSDIST（-1.5）=O.927O

♦正态分布函数NORMDIST的应用

例如：

已知某次测验的分数呈正态分布，平均分为75分，标准差为10分，试计算：

（1）低于80分的考生占多大比例，P（XV80分）=?

（2）80分以上的考生占多大比例，P（X>80分）=?

（3）80分以上，低于90分的考生占多大比例，P（80

P（XV80分）:

“=NORMDIST（79.5,75,10,1）”=0.6736

P（X为0分）:

“=1-NORMDIST（79.5,75,10,1）”=0.3264

P（80WXV90）:

“=NORMDIST（89.5,75,10,1）-NORMDIST（79.5,75,10,1）”=0.2528

♦标准正态分布区间点函数NORMSINV的应用

根据给定的向上累积概率P（Z

a=NORMSINV（p值）

例如：

P（Z1.28）=0.10

♦正态分布区间点函数NORMINV的应用

根据正态变量X的平均数、标准差和向上累积概率P（X

例：

已知某次大规模招聘考试分数呈正态分布，平均分为55分，标准差为12分。

现准备录取

10%的考生进行面试，录取分数线大致是多少？

P（X>?

）=0.10,即卩P（XV?

）=1-0.10=0.9,=NORMINV（0.9,55,12）=70.38,

最低分数线应为70分。

3•测验分数、测评等级的正态化：

根据被试样本原始分或等级的简单次数分布表，计算各个不同分数或等级的正态标准分数

（1）计算每个不同分数X（或等级）以下累计次数Fb；

（2）计算每个不同分数X（或等级）中点以下累积比率CP：

CPX=—Fb

（3）利用Excel统计函数NORMSINV，计算CP对应的正态Z分数。

（4）根据需要，将正态Z分数转为其他标准分数形式：

T分数、CEEB分数、托福考试分数、离差智商IQ等，

T=10Z50,CEEB=100Z500,TOEFL=70Z500,IQ=15Z100

4.偏态系数（SK）和峰态系数（Kurt）的计算与应用

偏态系数：

Excel统计函数SKEW;峰态系数：

Excel统计函数KURT。

偏态系数SK=0，对称分布；SK>0,正偏态分布；SKV0,负偏态分布。

峰态系数Kurt=0,正态分布的峰态；Kurt>0,次数分布的峰度比正态分布峰度低阔；

KurtV0,次数分布峰度比正态分布峰度高狭。

偏态系数和峰态系数都等于0或接近0时，变量的分布为正态分布。

5.二项分布的定义

二项分布是二项试验验结果的概率分布。

进行n次二项试验，各次试验彼此独立，每次试验时

某事件出现的概率都是p,该事件不出现的概率为q（=1-p），则该事件出现x次的概率分布为：

P（X=x）=b（x,n,p,）=C：

pXqn*。

二项分布的Excel统计函数：

BINOMDIST

6.二项分布函数BINOMDIST的应用

对20道四选一的单项选择题，如果完全凭猜测答题，那么

（1）猜对5道题的概率是多少？

（2）猜对5题以下概率是多少？

（3）猜对6题以上的概率是多少？

n=20,每题猜对的概率为p=0.25

（1）猜对5道题的概率P（X=5）=BINOMDIST（5,20,0.25,0）=0.20233

（2）猜对5题以下的概率P（X<5）=BINOMDIST（5,20,0.25,1）=0.61717

（3）猜对6题以上的概率P（X>6）=1-P（X<5）=1-BINOMDIST（5,20,0.25,1）=0.38283

7.二项分布的形态：

随n、p的变化具有不同的分布形态

（1）当p=q时，二项分布是对称分布。

（2）当p=q,np》5时，接近正态分布。

（3）当p为,npv5或nqv5时，二项分布为偏态分布。

（4）当p为,np》5且nq>5时，二项分布接近正态分布。

&二项分布的平均数和标准差

进行n次二项试验，每次试验时某事件出现的概率都是p，则该事件出现次数的理论平均数（」）、

方差（匚2）和标准差二分别为：

」二np,二2pq,、npq。

如果np>5且nq》5,成功事件出现结果的概率分布接近」=np、二=.npq的正态分布。

进行投掷100枚硬币试验，如果进行无数次试验，正面向上的硬币数目会在0〜100个之间变化。

那么，正面向上次数的理论平均数：

尸np=100X0.5=50，标准差为；「=..npq=_1000.50.5=5。

20道四选一的单项选择题，如果完全凭猜测答题，那么，

猜对题数的平均数为^np=20X1/4=5

猜对题数的理论标准差为；丁二..npq=.201/43/4=1.94。

第七章总体参数估计

1•常用的点估计：

总体均数卩的点估计：

用样本平均数X,Excel统计函数为AVERAGE

总体方差彳的点估计：

用样本标准差，或S2•―—。

n-1

总体标准差袖勺点估计：

用样本标准差Sn4，或n。

\n—1

2•总体平均数的区间估计

1•若样本均数的抽样分布为正态分布,

总体均数的0.95置信区间为:

X_Z0.052SEx

—s

=X_1.96

总体均数的0.99置信区间为:

X-Z0.012SEX

=X_2.58

2.若样本均数的抽样分布为df=n-1

的t分布，那么,

总体均数的0.95置信区间为:

—t0.05/2SEx-XJjt0.05/2

.n-1

总体均数的0.99置信区间为:

X二10.01/2SEx=X=to.01/2

.n-1

自由度df=n-1,t°.°52=?

t°.°52=?

也可查教材453页t值表

可用Excel统计函数TINV计算。

3•总体方差与标准差的区间估计

总体方差c2的0.95置信区间为:

nS2_2

02025八

nS2

或（n—1）Sn_L

2,^或

0.975

0.025

（n-1）S；」

V772，

0.975

总体方差

nS2

：

二2的0.99置信区间为：

nS2或（n—1）S；4

-2，或

0.995

—

0.005

自由度df=n-1的2分布右侧概率区间点的计算，也可用也可查教材475页2分布数值表

总体标准差b的置信区间：

取总体方差二2置信区间上、

4•总体积差相关系数的区间估计：

二

0.005

瞪995

Excel统计函数CHIINV。

下限的正平方根。

（1）

将样本相关系数r转换为费舍

Zr值，转换方法:

Excel统计函数FISHER

（2）

计算Zr的标准误

SEZr:

SEzr

n-3

（3）

计算总体Zp值的

1-a置信区间：

Zr_Z：

.2SEzr

（4）

0.95置信区间为:

0.99置信区间为:

计算总体相关系数

转换方法：

Excel

Zr--Z0.052SEZr

Zr-Z0.012SEZr

=Zr一258

P值的置信区间：

统计函数FISHERINV

将总体Zp值区间上、下限进行费舍逆转换,

5•总体比率（比例）的区间估计

n0_5,n（f_5时，样本比率

总体比率的0.95置信区间为:

0的抽样分布渐近正态分布。

=0_1.960<0

0-1.96SEp

总体比率的0.99置信区间为:

0-2.58SEp

=0_2.58

第八章假设检验

在Z检验中：

双侧检验临界值：

Zo.05/2=1.96Zo.0!

/2=2.58

单侧检验临界值：

Zo.o5=1.645Zooi=2.326

单侧显著性概率

双侧显著性概率

P：

=1-NORMSDIST（ABS（Z值））

P：

=（1-NORMSDIST（ABS（Z值）））*2

在t检验中：

单侧显著性概率

P：

=TDIST（ABS（t值），

df,1）

双侧显著性概率

P：

=TDIST（ABS（t值），

df,2）

1.单个样本

Z检验

主要用途:

分析单个样本均数

x与已知的总体均值g

的有无显著差异

适用条件：

（1）总体呈正态分布，总体方差匚2已知；

（2）总体是正态分布，总体方差匚2虽然未知，但样本容量n_30；

（3）即使总体非正态分布，总体方差二2也未知，样本容量n_30。

2.单个样本t检验

主要用途：

用于分析单个样本均数X与已知的总体均数g的差异,

df二n「1

3.单个样本比率Z检验

主要用途：

根据一个样本的比率

p,分析样本所代表的总体比率

P与已知比率P0有无显著差异。

适用条件：

np0_5,nq0_5

卩-Po

Po（1-P0）

4.两独立样本比率差异Z检验

主要用途：

根据两个独立样本的比率?

1-?

2，推断两总体比率P1、P2有无显著差异

适用条件：

两个样本相互独立，n1p1,n2?

2,n10,匕？

2都》5

01-？

（n1?

1+n2?

2）（门1嗥+门2电）

n1n2（n1n2）

5.两独立样本方差齐性检验

主要用途：

根据相互独立的两个样本的方差，推断两个总体的方差是否相等或是否有显著差异。

双侧显著性概率

P值：

=FDIST（F值，分子自由度，分母自由度）*2

6.相关样本t检验

主要用途:

（1）根据一组被试前、后两次测评结果，推断两次测验结果的总体均数有无显著差异。

（2）

X1-X2

根据实验组和配对对照组测评结果，推断实验组和对照组的总体均数有无显著差异。

适用条件：

两个样本的数据有—对应关系，且有可比性；两总体数据呈正态分布。

t=—^：

S-2S；-2rS1S2

Vn—1

独立样本

Z检验

主要用途:

根据两个独立样本的均数差异

适用条件:

（1）

两总体为正态分布,

总体方差

（2）

两总体非正态分布,

总体方差

（3）

总体c12、

两总体非正态分布，

z二X1

独立样本等方差假设t检验

主要用途:

适用条件:

总体方差

-X2

根据两个独立样本的均数差异

（1）两总体为正态分布，总体

-X2，推断两总体均数叫、二2有无显著差异。

-1

1、

■■-1

匚2已知,二；已知,

二2未知,

不管样本大小

m_30,

总体、匚2未知时:

n2_30时

X1—X2

|22

's1.s2.n「n2

（2）两总体非正态分布，总体

□、匚2是否相等，需要先做方差齐性检验。

注意：

大多数情况下，两总体方差基本相等。

两总体方差

x1_x2

t22

n1s1n2sf

n1n2-2

*（）

n1n2

独立样本异方差假设t检验

主要用途:

适用条件:

根据两个独立样本的均数差异

（1）

两总体为正态分布，总体

（2）

两总体非正态分布，总体

X1-X2，推断两总体均数

□、匚2未知，且

匚1、二2未知，且

叫、丄2有无显著差异?

_2_2

-1—2

_2_2

；_1h一2

，不管样本大小

X1-X2，推断两总体均数

、匚2未知，且-工匚；，不管样本大小二；、二；未知，且二；工；雳,厲—30,山―30时

丄1、丄2有无显著差异?

tX1-刃2

.n1n2

当n^i=n2=n时，df

当心2时，出飞行1）2（s2ny

口-1门2-1

10.积差相关显著性t检验

主要用途：

根据一对变量的样本数据及其积差相关系数适用条件：

两变量为连续性数值变量，且总上正态分布。

n_2

匚孑df=n-2

第十四章抽样原理及方法（参见教材）

r，推断两变量有无显著关系。

展开阅读全文