心理统计公式汇总复习.docx
《心理统计公式汇总复习.docx》由会员分享,可在线阅读,更多相关《心理统计公式汇总复习.docx(53页珍藏版)》请在冰点文库上搜索。
![心理统计公式汇总复习.docx](https://file1.bingdoc.com/fileroot1/2023-7/3/4a589eb9-7390-4b96-8173-8fc776343185/4a589eb9-7390-4b96-8173-8fc7763431851.gif)
心理统计公式汇总复习
心理统计公式汇总
第三章集中量数
1、几个集中量数的公式计算一览表
平均数
(M
算术平均数
(M)
n
ZXi
未分组:
x=y
n
分组数据:
M-送fi*Xci
Zfi
加权平均数(单位权重不相
等的情况)
送w•xi
Mw=__i——-送W
几何平均数(解决增长率的问题)
lgMg=无©;Mg=;M^NXi^I,Xn
N\X1
调和平均数
(解决速度的问题)
倒数的算术平均数的倒数:
Mh;
送丄
Xi
中数(Md
未分组:
无重复值
N+1
N-奇数:
中数即N1位置的数;
2
N=禺数:
中数即中间两个数的平均数;
有重复值
若重复值没有位于中间,则求法与无重复值时一致;
若重复值位于中间,则(P62):
图示:
思路:
①连续性数字,不是一个点,是一个区间;
②有几个重复的,则将组距除以几;
分组
Md=Lb+(”)•十
众数(M0
1、直接观察法。
2、公式法。
(皮尔逊经验法&金式插补法)
1皮尔逊经验法:
Mo=3Md—2M;
2金式插补法:
Mo—Lb+fa^i;
fa5
【组中值的计算】
第四章差异量数
第五章相关关系
相关系数
适用资料
公式
积差相关
(皮尔逊)
1成对的数据(》30对);
2连续变量;③正态双变量;④线性关系;
r=送Xy(N为成对数,x、y为离均差);
NSxSy
原始值代入:
EY
ZXY
r一N
等级相关
斯皮尔曼等级相关
(两列)
两列具有线性关系的等级或顺序变量;
6亍n2
1、等级差数法:
rR=1D(D为对偶等级之差)
n(n-1)
2、等级序数法:
rR=3•严RxRy(N+1)"
1RN-1■'N(N+1)
3、出现相同等级时:
222
瓦x2+瓦yD2
rRC仁一K一-
2•雄x•瓦y
32
甘中匸2N-Np—p—ttn(nj)
其中,x-12一瓦Cx;zCx—为12
(N为成对数据数目,n为各列变量相同等级数)
肯德尔等级相关(多列)
肯德尔W系数(和谐系数):
1K个评分人评N个对象,分析K个评分人的一致性程度;
2同一个人先后K次评价N个对象,分析其前后一致性;
1、基本公式:
*s;(K为评价者数,N
W—
123
石K(N-N)
为被评对象数)
W2
W——2Rj一-();(R为评价对象获得的K
K2N(N-1)N-10
个评价者给的等级之和,
_2_2
rZRiL2(瓦R)2
s—瓦(R-)—ZR2—'‘);
NN
2、相同等级时:
W-s;其中,s的意义同上,T如
丄K2(N3—N)—K5:
T
12
下:
3
XTn_n;(n为相同等级数)
12
肯德尔U系数(一致性系数):
对偶比较法:
将N个事物两两配对,可配成
N(N-1)/N对,然后对每一对进行比较,择优选择,优者记1,非优者记0;
8(送r;—K瓦rij)
U=j+1;
N(N-1)・K(K-1)
N为被评价对象数目(即等级数),K为评价者数目,
rij为对偶比较表中i>j(或ivj)格中的择优分数。
(几
个评价者认为i比j好,则为几)
质与量的相关
点二列相关正态连续变量&二分名义变量(真正的)
★
【用于非类测验(得分只有两种结果,答对得分,答错不得分)的测验内部一致性,每道题与总分的相关等问题;】
Xp_Xq
©=7pq;
st
(其中,p、q二分称名变量两个值所占比例,Xp与Xq为
二分称名变量各自对应值的平均数,St为连续变量的标准
差);
二列相关
1两列数据均正态
2一列为连续变量,一列为二分变量(人为划分);
Xp_XqpqXp_Xtp
lb-*;或「b—*;
StySty
其中,y为标准正态曲线中p值对应的咼度,查正态分布表可知。
多列相关
适用于两列正态变量,其中一列为连续变量,另一列被人为地划分为多种类别(名义变量);
「丿[(yr)・Xi]•其中
Ss£心曲―
Pi
Pi为每系列的次数比率,yL与yH分别为每一名义变量下
(上)限的正态曲线高度,可由pi差正态表得知;
品质相关
四分相关
两列都是连续正态变量,且都人为地被划分为两个类别。
相关资料可以整理成四格表;
180’
LC0S(肓)或(妊口
1+j-ad;或n=cos兀)
'beVad2bc
第六章概率分布
1、几个基本概念
(1)概率:
表明随机事件出现的可能性大小的客观指标。
(2)后验概率(统计概率):
先验概率(古典概率):
(3)概率分布:
对随机变量取值的概率分布的情况用数学方法(函数)描述。
2、概率的基本性质:
探概率的公理系统:
任何一个随机事件的概率都是非负的;
在一定条件下必然发生的必然事件概率为1;
在一定条件下必然不发生的事件,即不可能事件的概率为0.
探概率的加法定理
探概率的乘法定理
3、概率的分布类型划分
划分标准
分类
备注
依据随机变量是否具有连续性
离散分布:
离散随机变量的概率分布。
(如:
二项分布)
离散随机变量:
随机变量只取孤立的值。
(即计数数据)
连续分布:
连续随机变量的概率分布,即测量数据的概率分布。
(如:
止态分布)
依据分布函数的来源来分
经验性:
据观察或实验获得的数据而编制的次数分布或相对频率分布。
理论性:
一是随机变量概率分布的函数(数学模型),二是按数学模型计算出的总体的次数分布(总体分布)。
依据概率分布所描述的数据特征而划分
基本随机变量分布。
常用的有二项分布和正态分布。
统计量(随机变量的函数):
平均数、平均数之差、方差、标准差、相关系数、回归系数等。
抽样分布:
样本统计量的理论分布。
4、几个重要分布
★正态分布
(1)特征:
1正态分布的形式是对称的,对称轴是经过平均数的垂线。
2正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位于正负1个标准差处,曲线两端向基线无线靠近,但不相交。
3正态曲线下面积为1。
4正态分布是一族分布。
平均数决定其位置,标准差决定其形态。
标准差越小,曲线越狭高。
5正态分布中各差异量数值间有固定比率。
6正态曲线下,标准差和概率(面积)有一定的数量关系。
(2)正态分布表的利用
1已知Z分数求概率p,即已知标准分数求面积。
2已知概率P求Z分数。
3已知概率或Z求概率密度y,即曲线的高。
【直接查表即可。
注意已知的y是位于中间部分,还是
两尾。
】
(3)次数分布是否为正态的检验方法
(4)正态分布理论在测验中的应用
1化等级评定为测量数据
2标准测验题目的难易度
3在能力分组或等级评定时确定人数
4测验分数的正态化
二项分布(贝努里分布)
(1)几个重要概念理解
二项试验:
必须满足几个条件一一任何一次实验恰好只有2个结果;共有n次实验,n是事先给定的
一个正整数;某种结果出现的概率在任何一次实验中都是固定的。
二项分布:
试验仅有两种不同性质结果的概率分布。
(两个对立事件的概率分布)。
具体定义如下:
设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,某事件
不出
现的概率都是q,即(1-p),则对于某事件出现X次的概率分布为:
b(x,n,p)二C:
pxqn」;
Cn
n!
x!
(n-x)!
)
表示在n次试验中有X次成功,成功的概率为p。
(2)二项分布的性质
1二项分布是离散型分布,概率直方图是跃阶式。
(p=q与pzq)
2二项分布的平均数与标准差
当p5,二项分布接近正态。
此时有,卩=np,e=npq
(3)二项分布的应用
当p用其概率分布计算
当npv5,直接用二项分布函数计算
5、抽样分布一览表【样本分布:
指的是样本统计量的分布。
】
正态分布
样本平均数的分布
总体分布为正态,总体方差已知,样本平均数分布为正态分布。
2CT2CT
【卩X=卩;变异误°X=;标准误(SE)◎x=―^;】
nJn
总体分布为非正态,但总体方差已知,样本足够大(n>30),样本平均数渐进正态分
布。
【》X=A;aX】
pn
T
分布
含义及基本公式
学生式分布。
左右对称、峰态比较高狭,分布形态随样本容量n-1的变化而变化的一
、X-卩忆X2
族分布。
【t=/;S=J】
分布特点
1、平均值为0;
2、以平均值0左右对称分布,左侧t为负值,右侧为正值。
3、变量取值在
4、当n趋近于无穷大时,t分布为正态分布,方差为1;
当n-1>30,t分布接近正态分布,方差大于1,随n-1的增大而渐趋于1;
当n-1v30,t分布于止态分布相差较大。
分布表的使用
t0.05(双侧)=t0.025(单侧)
总体分布为正态,总体方差未知时,样本平均数为t分布。
样本
平均
数的
【Sx=注1=手,其中,2栏1】
分布
总体非正态,总体方差未知,右n>30,则近似正态分布。
随机变量平方和的分布;或随机变量转为标准分数,标准分数的平方和的分布也服从
堅分布。
概念
与公
2乞(X-W2
【工2-2或用样本平均数估计总体总体平均数卩时为
式
a
7.2
分布
了2》(Xi-X))ns2-
acr
1、正偏态分布。
df趋近无穷大时,为正态分布。
分布
2、■/2值都是正值。
特点
3、工2分布的可加性。
即卡方分布的和也是乂2分布。
应用
计数数据的假设检验;样本方差和总体方差差异是否显著的检验;
含义
与公
“22.22
【FLi/dfiFF"】
F
分布
式
'2/df2Sn24/°2Sn2」
分布特点
1、正偏态分布;
2、F总为正值;
应用
F检验:
考察任意两个样本的方差是否取自冋一整体;方差齐性检验与方差分析;
第七章参数估计
1几个重要概念
a)、置信度(置信水平即1-a)、
2、参数估计步骤总结
(1)分析条件,选择方法,计算样本统计量;
(2)计算样本平均数的标准误;【是关键!
!
】
T分布表:
X-1:
/2齐丁X」-Xt/2或X-t(1_:
.)/2y「X_」-X't(i_:
.)/2y「X
3、参数估计一览表
总体平均
总体方差已知
(正态估计法)
①总体正态分布。
②总体非正态,
标准误为crX=上二
n>30(近似正态估计法)。
数
①总体正态分布。
②总体非正态,
n>30(近似t分布估计法)。
的估
总体方差未知
(t分布估计
标准误采用样本的无偏方差作为总体方差的估计值刖仃s
.一気-1
计
法)
XJn-1
Vn
法1:
米用总体方差估计区间的平方根。
法2:
n>30(样本标准差的分布为渐进正态),
标准差
标准差的平均数为X=G,标准差分布的标准差为
V2n
标
准
则置信区间为:
Snj-Z^^s
差
自正态总体中,随机抽取容量为
n的样本,其样本方差和总体方差的比值的分布为
与方
7-分布,故可直接查7-表来确定
乞和鼻亠/2,置信区间为:
方差
(n-1)s:
」厶2/n-1)sn_L
差的
了2、、了2
区
仪2(1£/2
间
亠22
2
估
置信区间为1VvMf/T;
计
FCt2Sn2-1°2
Sn2-1
一总体方差之
巧2
比
定区间内(即区间是否包含1),
可推论二总体方
根据样本方差估计2在1上下一
©2
差相等。
若只关注两个总体方差是否相等则用单侧,若要比较二者谁大谁小则用双侧。
相
积差
总体
即P=0时。
样本相关系数分布为
t分布,。
T
关
相关
系数
【思
相关
系数
rg
路:
先
置信区间为:
r—tg汉S兰卩兰
的
假设
为0
r+t皿5;
区间估计
P=0,求出置信区间,若不包含0,说明假设错误,再根据P不为0的情况来解题。
】
总体相关系数不为
0
一2、、
当n>500,crr畑;置信区间为:
r—Z^/2汽0|•兰4兰r+Z创2工口\
利用费舍Z函数分布计算(应用广泛,不论P是否为0,不论样本容量n的大小)。
步骤:
1将样本相关系数转换为Z函数。
11+r1+r
法1:
公式法。
Z-loge或Z—1.1513xlog10()
21-r1-r
法2:
查r-乙转换表,直接由r值查乙值。
1
2计算标准误:
SEZ=J
7^3
3计算乙的置信区间:
乙土Z肿S&;
4将Zr的置信区间转换为相关系数。
(公式法或查表)
等级相关
(斯皮尔曼)
1当9wnw20时,rR的分布近似为df=n—2,S£=的t分布。
Jn-2
置信区间为:
rR土以2汉(df=n-2)Jn-2
/TV
2当n>20时,rR的分布近似正态分布,标准误为R
Jn-2
置信区间改为:
rR土Z癡2汇£=(df=n-2)
Jn-2
比率及比率差异的区间估计
比率的区间估计
当np>5,标准误ap或SEp^Pq;置信区间为
p-Zg・SEpY4pYp+Z/・SEp
【ps:
样本比率p=x/n,是总体比率p的点估计值,可代替总体比率。
故▽p=^-pq】
当np兰5,此二项分布不接近正态,此时置信区间的估计直接查二项分布计算的统
计表。
比率差异的区
间估计
当色5,n2P2兰5时,比率差异的置信区间可用正态分布概率计算。
|>*AA|
1.1'I
①口式P2时,标准误为▽p,』一jP"1+卩凶2;置信区间为
2*n,n2
A
(p1一p2)土Z&2沃◎p,_p2;
②ppp时匕沁泪出斥r丿(山5+匕卩2)(口5十nzq?
);
②口—p2—P时,标准误为◎Dp—DA申—弘1/、;
pp2¥mn2(m+n2)
A
置信区间为(p;一P2)±Z&2汽▽p,_p2;
当pi=p2=P,总体比率之差为o,对于它的置信估计可理解为,样本比率之差
A
(»-p2)在多大范围内可以认为是取自比率差为0的总体。
第八章假设检验
【假设检验】,即差异显著性的检验,包括总体和样本之间的差异以及样本和样本之间的差异。
1几个重要概念
假设检验小概率原理、I型错误&n型错误、统计检验力(1-B)、双侧8单侧检验、
2、假设检验的步骤
①根据问题要求,提出
H0和H1;
②选择适当的统计检验量;
③确定显著性水平a;
④计算检验统计量的值;
(计算标准误,计算临界的
Z或t值)
⑤做出决策;
5、假设检验一览表(
4种主要的检验方法:
Z检验、
t检验、F检验、
2检验)
平均数的显著性检验
(样本是否来自总体)
总体正态
XPb
1、总体方差已知:
【Z(卩)检验】临界值Z=0(卩),其中,SEX=bX=$;
sexJn
Xps
2、总体方差未知:
【t检验】临界值t=X0,其中,SEX=旦=乍
SEXJn-1Jn
总体非正态
1、当n》30(样本容量足够大)
1总体方差已知可用Z检验。
(因为是近似正态,故用Z'表示,公式方法冋上)
2总体方差未知时,可直接用样本标准差s代替总体标准差巴,其他不变)
2、当nv30,不可用Z或t检验,只能选择非参数检验。
平均数差异的显著性检验
两个总体
两个总体方差都已
(X1-X2)-(叫一卩2)Dx—%一
彳训」T卄卄旳田/古7*12F»1乙'入X
1、独立样本:
临界值Z—-
SEdxSEdx
(两个样本是否来自
都正态
知【Z】
其中,SEdx
加-
2
^2
同一总
DX-七
体)
2、相关样本•临界值同上为Z_(Xl—X2)—(已—巴)
11_1、111♦1宀>
J—
—
SEdx
SE-
其中,SEdx=、
2
°2°°1°2
1、独立样本。
①两个总体方差一
xX
致或相等。
(齐性)临界值t=Xi—2
(df=a+n2-2)
SEdx
其中,SE^、
]sp(—+—);其中,Sp为联合方差,sp
ini压
2丄2
口$+n2s2
n,+n2-2
一、》,、、,2
(联合方差Sp是总体方差取好的估计值)
②两个总体万差不齐性。
-
柯克兰-柯克斯t检验
t'Xi-乂2
X-x
12(用各自的无偏估计量)
22汽4+Sn2
-1
22
E
n-1n2-1
两个
总体
SEX.吠诡
+SE:
•t2(c)
3・/杏f借Fb十rlf—4、
+seX
;(查t值时,df=l丿
方差
aSE2i
都未
知【t】
【PS:
若实际得到的t'
>ta,则认为两个样本的平均数在
a水平差异显著】
2、相关样本。
①相关系数未知。
t=X「X2(df=n
-1);(用d表示每一对数据对应的数据之差。
)
SEd一
X
-拓,20
d)2
其中,二、
2工(d—d)2瓦d-;sd-一
n_.
nn
②相关系数已知。
x“一x2
...一Is.2+s2-2rs1s2
t-(df-n
-1);其中,SEdxp
SEdx
xVn-1
两个总体非正态
当样本容量足够大时:
【Z】
1、独立样本:
Z‘—XlX2或Z‘—XlX2(方差未知时以样本方差代替各自的总体方差)
丫n-jn2qn1n2
2、相关样本:
X1—X2
2
+员一20£
n
Z'
-X-X2或Z'_
^2+(J2-2^^t2忖
VnV
样本
■-j2I-.j
2
2ns
止态总体中样本,其样本方差与总体方差比值的分布为
上分布,即/
2
与总
a0
体
从
/表中查//、鼻(1以2)(df1,)
,当尤I]或北2YJ
,差异显著。
方差的
2
独立样本:
【F检验】F大
差异检
1、
验
样本
2
s小
之间
2、
相关样本:
【t检验】+
22
S—S2
((df=n-2))
Rs2s2(1-r2)
n-2
1、
p=0(r的分布近似正态)【t检验】t—一r_—
(df=n-2)
\n—2
积差
2、
p工0,将r和P都转化为费舍Zr,
然后再进行【
Zr
Z检验】Z--
-Zp
相关
J.
1
相关系
n-3
数的显
著性检
【总结思路】:
题目若未说明p是否为
0,则先假定
p为0,若计算得出要拒绝H0(P=0),
验
则必须重新再用p丰0的方法来算一遍。
1、
点二列相关
2、
二列相关
其他
3、
多列相关
类型
4、
四格相关
相关
5、
斯皮尔曼等级相关
6、
肯德尔W系数
相关系数差异
(仅论积差相关情况)
1、r1和r2分别由两组彼此独立的被试得到。
将r1、r2分别进行费舍Zr的转换。
【Z检验】
2、两个样本相关系数由同一组被试算得P12、
首先计算3列变量的两两相关系数P12、P23、
Z=-
。
23、
卩13,=n-
Zp,_Zr2
11+1
*n,—3n2-3
13,检验卩12与卩13的差异。
然后进行【t检验】
-3)
t=
(r12-「13)n-3)(1+r23)(df
J2(1—r12-r13-r23+2*r12*r13*r23)
比率
np》5,【Z检验】Z_P0
的显
1、
著性
2、
Po叫
Vn
npW5,直接查表一项分布置信上下界限