北京大学心理学重要实验设计课件.docx
《北京大学心理学重要实验设计课件.docx》由会员分享,可在线阅读,更多相关《北京大学心理学重要实验设计课件.docx(24页珍藏版)》请在冰点文库上搜索。
北京大学心理学重要实验设计课件
第一讲导论:
心理实验研究的哲学基础
一、笛卡尔(1596-1650)和艾宾浩斯(1850-1909)
1.笛卡尔“身心二元论”:
“我思故我在”,我的全部本性在于思维作用,认识外界事物必须靠心灵。
心灵与形体彼此独立。
“身心交感论”:
除了天赋观念、意志以及思维仍由心灵认识外,感觉、爱、恨、恐惧等是这一相互作用的结果。
2.艾宾浩斯的“遗忘曲线”
艾宾浩斯成功的关键在于他对可能会对结果产生影响的额外变量的控制上。
以无意义音节作为词语学习的实验材料──如“DIQ”、“KOP”等。
采用这些材料可以达到几个目的:
(1)控制难易度;
(2)控制熟悉度;(3)控制单元间的联结强度。
(4)使用德文字母组合了约2300个无意义音节,解决了词语材料可能重复的问题。
采用序列学习法:
把学习材料的各个单元项目排成序列,形成一个词单,在学习时,每个项目都按词单中固定的顺序依次一一呈现给被试,词单呈现完毕,被试开始回忆每个单元项目及其序列位置。
例如,第一单元项目是“DIQ”,第二个是“VIF”,中间的记不清了,最后一个项目是“KOP”,如此等等。
如果被试不能正确回忆所有的单元项目,或达到预期的学习标准,就必须继续接受另一次学习回忆期,如此等等,直到被试达到预定的学习标准。
以节省百分数为因变量,研究了间隔时间与遗忘的关系,采用了6个不同水平的学习和回忆的间隔时间:
20分钟、1小时、8小时、24小时、2天、6天以及31天。
结论:
开始一段时间遗忘较快,随着间隔时间的增加,遗忘速度减慢。
二、科学研究的实证原则:
为什么艾宾浩斯的研究富有生命力?
1.什么是科学
科学与形而上学的分界(KarlR.Popper):
可证伪性、可验证性(可重复性)
科学的研究程序:
问题假设→实验研究→理论→新的假设……
胡适:
“大胆的假设,小心的求证”(观察、实验、归纳、推理、直觉)
2.什么是科学的心理学
科学的心理学旨在寻找心理行为过程的规律,揭示心理行为过程中各变量间的因果关系。
三、为什么要强调方法的重要性
1.心理学的研究对象──人(或人的心理)十分复杂
2.心理学存在着分裂的可能性?
既有“作为自然科学的心理学”,又有“作为社会科学的心理学”
3.到目前为止,心理学之所以尚没有出现一个公认的、能解释各种心理现象的理论体系,其根本原因何在?
按照库恩(T.S.Kuhn)的所谓“范式”(Paradigm)理论,目前的心理学仍处于尚未成熟的前范式阶段,还不是一门规范科学(normalscience)。
一个处于前范式阶段的学科要成为一门规范科学,资料的收集与积累将是一不可缺少的过程。
4.在心理学尚无统一范式的情况下,研究方法十分重要:
方法已成为资料获取的准确性、丰富性以及资料概括和提炼的直接制约因素。
四、心理研究的多种途径(质的研究与量的研究)
解释学(或释义学、诠释学)方法:
通过对心理现象的解释来达到对隐藏在心理现象背后的意义的理解(弗洛伊德对梦的解释)。
例如,访谈法。
现象学方法:
对研究对象进行整体描述,即面向现实中的事物本身(格式塔心理学和人本主义心理学);二者均强调从精神的和社会文化方面研究人的心理。
例如,观察法。
实证方法:
强调心理研究的客观性,它要尽可能排除影响研究对象的任何主观因素
问卷法:
一种相关研究方法,采用问卷调查,探讨变量间的相关,用于预测和估计
测验法:
实验法(狭义的实证研究):
目的在于最大限度地揭示心理行为过程中各变量间的因果关系。
现场实验研究(准实验法)
第二讲如何建立变量间的因果关系
一、心理实验研究中的变量
变量:
在质或量上能产生变化的事物的属性
刺激变量
反应变量
机体变量
建立这些变量间的关系,最好是因果关系
Y=f(X1,X2,……,Xn)
实验中实验者所操纵的对被试反应产生影响的变量称为自变量(independentvariable),由操纵自变量而引起的被试的某种特定反应称为因变量(dependentvariable)。
但是,除了自变量之外,还会有其它许多因素会影响因变量的变化,凡是对因变量产生影响的变量都可称为有关变量(relevantvariable),对因变量不产生影响的变量都可称为无关变量(irrelevantvariable),在有关变量中,实验者拟研究的变量称为自变量,不打算研究的那些有关变量称为额外的有关变量(extraneousrelevantvariable),简称为额外变量(extraneousvariable),由于实验中必须要控制这些额外变量,故额外变量也被称为控制变量(controlledvariable)。
因变量
因变量的信度:
同一刺激情况下的变异程度
因变量的效度:
能否真正测到因变量在不同自变量水平下的变化程度
采用公认的因变量
避免ceilingeffect与flooreffect
采用多项测量
变量的操作性定义:
采用测量它的操作程序来测量
二、如何建立变量间的因果关系?
穆勒五法
1843年,英国哲学家穆勒(JohnS.Mill,1806-1873)在其名著《逻辑体系》中系统地论述了探求因果关系的五种方法,为通过实验研究揭示心理行为过程中变量间的因果关系提供了一般方法论基础。
契合法
若A,B,C→a,b,c
A,B,D→a,b,d
A,C,E→a,c,e
A是a的因
差异法(使用对照组)
若A,B,C→a,b,c
B,C→b,c
A是a的因
契合差异并用法
若A,B,C→a,b,c
A,D,E→a,d,e
A,F,G→a,f,g
B,M,N→b,m,n
D,O,P→d,o,p
F,Q,R→f,q,r
A是a的因
共变法(当有些现象无法消除从而不能使用对照组时)
A1,B,C→a1,b,c
A2,B,C→a2,b,c
A3,B,C→a3,b,c
结论:
A是a的因
剩余法
A,B,C,D是a,b,c,d的因,而A是a的因,B是b的因,C是c的因,则D是d的因
上述方法均有一定局限性,应用是否成功的关键在于心理变量能否进行正确有效的分离
一个例子:
Waugh和Norman关于短时记忆遗忘的研究
三、额外变量的控制
(1)排除法:
将额外变量从实验中消除;
(2)恒定法:
使额外变量在实验过程中保持固定不变,同一主试、同一时间、同一仪器等;
(3)匹配法:
使实验组和控制组中的被试特点相等(独立组设计);
(4)抵消平衡法:
通过采用综合平衡方式使额外变量的效果互相抵消(重复处理设计所产生的顺序效应);
(5)随机化法:
随机抽样并把样本随机地分配到各处理组、让刺激随机呈现等(已知有额外作用但不适于上述方法;无法确定起作用的额外变量来源);
(6)统计控制法:
由于条件限制不能采用上述方法时,可在实验后采用协方差分析等统计方法来控制额外变量。
四、心理实验中主试与被试的关系
指导语
主试的期待:
实验者效应(Rosenthal,1966),主试可能以某种方式(如表情、手势、语气等)有意无意地影响被试,使其反应符合主试的期望
被试的动机:
霍桑效应(Hawthorneeffect),由于被试对实验态度发生了变化从而导致研究的自变量发生混淆
安慰剂效应(placeboeffect)
双盲控制
五、心理实验研究的效度:
内部效度、外部效度
外部效度以内部效度为基础,没有一定的内部效度,永远不会有外部效度。
第三讲心理研究的程序
一、发现问题,陈述问题,形成假说
生活事件观察、文献阅读
PsychologicalAbstracts、PsychInfo
1.CognitivePsychology
2.CurrentDirectionsinPsychologicalScience
3.Intelligence
4.JournalofEducationalPsychology
5.JournalofExperimentalPsychology:
General
6.JournalofExperimentalPsychology:
Learning,Memory,&Cognition
7.Memory&Cognition
8.PsychonomicBulletin&Review
9.PsychologicalReview
10.AmericanPsychologist
11.BritishJournalofPsychology
12.QuarterlyJournalofExperimentalPsychology
13.DevelopmentalPsychology
14.心理学报
15.心理科学进展
16.心理科学
以假说的形式陈述问题。
如果,那么。
假说如何形成?
长期的思索、意外的发现、直觉与灵感
好的假说的特点:
可验证性、简洁性、概括性
举例:
“勤奋的学生学习成绩好”,其中,勤奋应该作具体定义,学习次数或学习时数。
二、确定研究类型
自然观察法:
在自然环境下观察、记录自然发生的行为,Lorenz观察动物攻击行为、印记行为等,珍尼古多尔在原始森林观察黑猩猩行为;
调查研究
档案研究
准实验研究:
不能以随机方式分配被试,只能根据已经形成的群体推论因果关系
社会学研究、社会心理学研究等
实验研究:
随机抽样选择被试、操纵自变量,可减少误差,对实验研究的许多批评源于对实验研究本质的不甚了解。
探索性实验与验证性实验
预备实验
三、实验研究过程
1.发现问题,陈述假说
2.界定变量:
自变量、因变量、控制变量
3.选择仪器
4.确定实验方案:
选定何种实验设计
5.选择和分配被试:
界定总体和样本:
所有可能参与研究的个体为总体;从总体中抽取部分个体,组成实验受试者,为样本。
样本应有代表性
取样:
随机取样和分层随机取样;随机分组以获取等组被试;随机会产生波动,但仍是最好的方法。
6.数据采集与处理:
计划、指导语、时间安排等
数据类型:
比例型数据:
身高、体重、反应时间等,有相等单位,有绝对零点,可加减乘除
等距型数据:
温度、智商、能力大小等,有相等单位,无绝对零点,可加减
等级型(顺序型)数据:
喜好程度等,无相等单位,无绝对零点,不能加减乘除
类别型数据:
气质类型、性格类型等,无相等单位,无绝对零点,不能加减乘除
数据处理:
合理正确的统计方法极为重要,参数检验,非参数检验
7.得出结论,检验假说
8.撰写研究报告
题目摘要正文前言方法结果讨论结论参考文献
第四讲随机组设计
一、双随机组设计
1.一个例子:
维生素C对感冒的作用
从总体中抽取60名被试,随机分为实验组与控制组。
实验组:
服用维生素C
控制组:
服用同样形状的淀粉颗粒
观察今后6个月内患感冒的次数
设计关键:
实验前必须确定两组在各方面相等(包括要记录的因变量)
2.如何达到等组?
相对大的样本;随计化原则:
随机抽样、随机分组
若为小样本,两组被试各方面容易波动,较难“相等”
大样本更容易减少两组之间的差异,但仍可能由于随机波动出现不等组。
另一例子:
RNA是否与记忆有关?
3.统计分析
虚无假设:
两组因变量的总体平均数之间无差异;
计算平均数
计算t值。
t值反映两组平均数之间的差异程度,若差异很小(即不显著),则差异是由于随机波动而产生的,反之则是实验处理导致的;
计算自由度:
df=n1+n2–2;
若t(13)=4.48>4.22(此时α=0.001),可得出结论P<0.001,其含义是:
两组之间的差异1000次中999次由实验处理导致,没有差异的可能性只有1次,由此而拒绝虚无假设。
P值的设定与实际要求有关,如要求高度安全,可设定得更保守(P值更小)。
一般情况下设定为0.05就够了。
被试数量应该多大?
每组30人以上可算大样本,足以达到要求。
4.讨论:
如何使两组有效区分开?
尽可能选择同质被试;实验程序严格标准化;减少测量误差
二、多随机组设计
1.单因素多水平实验设计
自变量水平越多,评估它对因变量影响的准确度就越高。
多随机组显然优于两随机组
不同水平的差别尽可能大一些
如gifted,Learningdisability,normal三组儿童的数学能力比较。
2.统计分析
为什么做两两t-test并不合理?
假定自变量设为3个水平,若显著性水平α=0.05,则正确作出推翻虚无假设的概率为95%,所有3次t-test都正确的概率为0.953,至少有一个t-test结论不正确的概率为1-0.953,增加了拒绝虚无假设的可能性。
改进方法:
提高拒绝虚无假设的标准,对于本研究,修正后的α=0.05/3才等于单个t-test中α=0.05的情况。
Bonferronitest
虚无假设:
不同组间因变量的总体平均数之间无差异
计算总平方和SST、组间平方和SSB、组内平方和SSw
计算自由度:
dfT=N–1
dfB=组数–1
dfW=N–组数=dfT–dfB
计算均方
组间均方MSB=SSB/dfB
组内均方MSW=SSW/dfW
计算F值:
F=MSB/MSW
F=(组均差的估价值+误差的估价值)/误差的估价值
若F=1,则不存在实验处理效应,即自变量对因变量无影响。
若F显著,表示各组总体平均数间存在差异,仅表示至少有一对平均数间存在差异,要进一步明白此点可进行多重配对比较。
第五讲相关实验设计
一、相关研究
当无法控制自变量的变化时,可采用相关研究,它通过计算变量之间的相关系数来衡量变量之间的联系。
1.相关研究的应用领域
变量之间的联系(如身高与体重、人口数量与教育程度)
测验的信度与效度
2.正相关、零相关、负相关
3.偏相关(部分相关)
4.相关研究的意义:
预测功能
二、双匹配组实验设计
1.目的与意义:
对于随机组设计,随机永远只是一种理想状态,为了达到实验前的两组相等的状态,可使用匹配组设计。
举例:
性别对记忆是否有影响?
以智力作为匹配变量
2.匹配变量的选择:
(1)匹配变量应与因变量有较高的相关,相关程度越高,匹配或等组的可能性越大;
(2)将因变量作为匹配变量,但可能产生顺序效应。
3.统计分析(pairedt-test)
虚无假设:
两组因变量的总体平均数之间无差异;
计算平均数
计算t值(相关样本的t值)。
t值反映两组平均数之间的差异程度,若差异很小(即不显著),则差异是由于随机波动而产生的,反之则是实验处理导致的;
计算自由度:
df=n–1(n:
配对数);
4.讨论:
采用随机组设计还是匹配组设计?
随机分配并不一定随机;
匹配设计应保证匹配变量与因变量的高相关,否则会对研究造成损害;
不合适的匹配设计降低了能检出两组存在差异的程度;
故,若找不到合适的匹配变量,则应采用随机组设计。
三、重复处理设计
1.二次重复处理设计
pairedt-test
2.多次重复处理设计
被试接受实验处理的顺序:
随机或抵消平衡法
虚无假设:
不同组间因变量的总体平均数之间无差异
计算总平方和SST、被试间平方和SSB、被试内平方和SSw
SST=SSB+SSw
SSw=处理间平方和+误差平方和
由于进一步将被试内变异分解出了处理间平方和与误差平方和,从而大大降低了MSE,从而提高了能检出处理效应的程度。
比较:
随机组设计
总平方和SST=组间平方和SSB+组内平方和SSw
组内平方和SSw=误差平方和
在检出存在总体显著差异后,如有必要,仍需做多重比较。
3.重复处理设计的优缺点
优点:
经济利用被试;节约实验时间;减少实验误差
缺点:
容易产生顺序效应
存在这种可能:
对于同一问题,重复处理设计与组间设计可能产生相互矛盾的结果。
第六讲因子设计
一、几个例子
研究者甲:
智力对学习成绩的影响不大
研究者乙:
智力对学习成绩的影响很大
研究者丙:
年龄对记忆能力有很大影响
研究者丁:
年龄对记忆能力的影响不如常说的那么大
智力对学习成绩的影响可能因兴趣的不同而有差异。
不同年龄人群的记忆能力差异可能因受教育程度不同而有所不同
人参对人体的滋补作用在有无胡萝卜的情况下是否有不同?
二、几个概念
因子
因子变化的水平
各水平的结合(组数、单元数、处理单元等)
主效应:
一个自变量的不同水平引起的因变量的变化程度
交互作用:
一个自变量对因变量的影响由于其它自变量水平的不同而有所不同时,则这两个自变量之间存在交互作用。
三、统计分析
虚无假设
因子A的处理效应为零
因子B的处理效应为零
A、B两因子的交互作用为零
总平方和SST的分解
SST=SS处理间(组间平方和)+SS处理内(组内平方和)
SS处理间=SSA+SSB+SSAB
自由度分析:
设因子A有p个水平,因子B有q个水平,每个处理单元有n个被试,则
变异源
自由度
A
p-1
B
q-1
A、B交互作用
(p-1)(q-1)
单元内误差
pq(n-1)
总计
npq-1
计算均方
MSA=SSA/dfA
MSB=SSB/dfB
MSAB=SSAB/dfAB
MSE=MSW=SSW/dfW
计算因子效应(F值)
FA=MSA/MSE
FB=MSB/MSE
FAB=MSAB/MSE
四、交互作用的意义
人的心理行为通常由多种变量的交互作用所控制,仅研究一个变量的影响是十分简单的。
例如一些简单的判断:
“某人很聪明,在校学习成绩一定很好”。
学习成绩的好坏取决于多种因素,除智力高低外,其他因素如兴趣、动机等都影响学习成绩。
五、因子设计的价值
可获取较多信息,增强研究结果的概括力
经济
六、因子设计的类型
2×2
2×3
3×3
2×2×2
被试内设计、被试间设计
完全随机实验设计
完全重复实验设计
混合实验设计
七、总结:
选择何种实验设计?
好的实验设计所具有的特点:
1.能回答要研究的问题;
2.通过同一批被试能给出较多信息;
3.可重复性强(较高的实验内部效度);
4.结论的概括性高(较高的实验外部效度);
5.经济可行
总体来看,不同的实验设计彼此间无绝对优劣之分,选择什么研究依赖于研究的问题和条件。
但在一定情况下,存在一个最合适的实验设计。
第七讲准实验设计
一、准实验设计的含义与应用领域
未能完全控制额外变量的实验设计,主要是,并未按随机的方法将被试分配到各实验组。
但任何实验设计都不可能达到绝对严格。
即使最完善的实验设计,也可能得到错误结论,例如拒绝了一个不应该拒绝的虚无假设。
在无法采用严格的实验设计的情况下,只能通过控制一部分额外变量寻求结论,此即准实验设计。
如现场实验研究。
准实验设计采用的符号系统
X:
实验处理;
O:
对行为的观测,O1、O2、……代表观测次数
二、准实验设计类型
1.单组后测设计
X
O
分析:
总体上难以解释的设计
2.单组前测后测设计
O1
X
O2
Pairedt-test
缺点:
缺乏适当的对照组
可能存在霍桑效应或安慰剂效应:
例如对新教学方法的期望会自动产生好的结果;
可能存在练习效应
结论:
总体上难以解释的设计
3.不等同比较组设计
3.1不等同比较组后测设计
X
O
O
两组非随机分类,故只能看作比较组,非控制组,很难说明因果关系。
分析:
将两组之间因变量(观测结果)的差异归于处理作用的可靠性仍很低,仍难以得出明确的结论。
仍属于“总体上难以解释的设计”。
一种改进的设计:
X4
O
X3
X2
X1
O
O
O
O
例子:
辅导时间与学习成绩的关系,t-test
两者具有因果关系的可能性更大了
3.2不等同比较组前测后测设计
O1
X
O2
O1
O2
可能是最普遍使用的一种准实验设计
可先对每一组的前后观测值进行pairedt-test,然后对两组之间的前后观测的差值作独立t-test。
缺点:
由于不是随机分配各组,仍无法排除各种额外因素的影响。
4.中断时间序列设计(interruptedtime-seriesdesign)
简单中断时间序列设计
O1
O2
O3
O4
O5
X
O6
O7
O8
O9
O10
适用于无法找到控制组的情形;可能存在霍桑效应
复合中断时间序列设计
O1
O2
O3
O4
O5
X
O6
O7
O8
O9
O10
O1
O2
O3
O4
O5
O6
O7
O8
O9
O10
例子:
推行改革,先试点
中断时间序列设计的问题:
观测变量变化缓慢需要很长时间才能发现、或难以观察到;
统计分析复杂;
数据采集不容易。
总体评价:
严格地说,单组后测设计、单组前测后测设计、不等同比较组后测设计没有控制任何变量,是一种自然描述,属于“非实验设计”,不是准实验设计。
第八讲小样本实验设计
一、大样本研究范式与小样本研究范式
1.大样本研究范式特点
随机化抽样、实验控制、统计程序的大量运用
但不适于临床心理研究、不易追踪测量和深入分析
2.小样本研究范式
组平均数仅是一抽象的数值,不能代表组内任何一个个体的实际状况
早期的研究:
巴甫洛夫的条件反射研究、斯金纳的研究、电生理研究
适宜研究的领域:
临床研究(个案研究)、行为治疗、药物评估
二、小样本研究的程序
1.建立基线:
确定研究对象的反应基线
基线:
实验处理前因变量的变化水平,理想的基线是“稳定的”,即无明显变化趋向,随机起伏。
2.施加自变量,观察记录因变量的变化,直到因变量变化再次稳定
3.撤除自变量,继续监测因变量的变化
若因变量变化回复到原来水平,可认为自变量与因变量间存在因果关系。
误差及其控制:
被试间个体差异、实验过程的误差
小样本研究通常只有第2种误差来源,控制办法:
消除、恒定(同一程序、主试、时间、地点、仪器等)
因变量的选择需考虑:
客观性、重复性、敏感性
三、小样本研究类型
1.A—B—A设计
白鼠按压杆杠实验:
禁食与行为反应
2.A—B—A—B设计(用于临床治疗、行为矫正等领域)
在A—B—A后再施加自变量,观察能否产生预期的变化
3.A—B—A—C—A设计
施加不同自变量
4.A—B1—A—B2—A设计
同一自变量施以不同水平
以上设计的前提:
自变量对因变量的作用是暂时的、可逆的。
若撤除自变量后因变量的变化无法恢复到基线水平,则有两种可能:
自变量的作用并非暂时;自变量的作用未明确证实,可能有其它额外因素影响。
讨论:
A—B设计的缺陷
5.A—B多基线设计(multiplebaselinedesign)
6.A—B多反应设计(multipleresponsedesign)
四、小样本设计优缺点
内部效度极高、外部效度低、费时、易出现顺序效应
第九讲反应时间与心理过程的分离
反应时间
从刺激呈现到反应开始之间的时距。
反应潜伏期。
包括感觉器官与大脑加工、神经传入与传出、肌肉效应器反应所需的时间,其中大脑加工所耗费的时间最多。