心理学研究方法大纲心理学研究方法精要第7版Word格式文档下载.docx
《心理学研究方法大纲心理学研究方法精要第7版Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《心理学研究方法大纲心理学研究方法精要第7版Word格式文档下载.docx(18页珍藏版)》请在冰点文库上搜索。
是两个变量间相互关系的明确陈述
非定向研究型假设
表示群体间存在差异,但差异的方向是不确定
的,诶不等同
定向研究型假设
表示群体之间存在差异,而且差异的方向是确定的,如多于,少于虚无假设与研究假设的区别5
等价,不等价虚无假设表示两个变量之间没有关系,而研究假设表示两个变量之间有关系
总体,样本
虚无假设总是针对总体,而研究假设总是针对样本
间接检验,直接检验虚无假设只能被间接检验,而研究假设才能被直接检验
希腊字母,罗马字母暗含假设,明确假设虚无假设是一个暗含的假设,研究假设是明确的假设
什么是一个好的假设?
5
陈述句
假定变量之间的关系反映理论和文献基础简明扼要可检验
样本和总体
显著性水平是不能百分之百的确信差异是由处理因素引起的,还是可能由一些不可预料的因素导致的而要承担的风险。
3:
问题选择与文献回顾,伦理问题
为什么研究领域的选择是及其重要的?
花费大,需兴趣开好头
评价研究论文的标准8
研究回顾参考文献与以往研究的密切程度?
文献回顾的内容是否为近期的研究?
有没有一些重要文献被忽略?
研究问题和研究目的
关于研究目的/目标的陈述是否清晰?
2是否建立在前人的基础上?
研究假设
假设是否进行了清晰明确的说明?
对变量间关系的陈述是否清晰?
假设是否具有可验证性?
研究方法
自变量和因变量的界定是否明确?
变量的界定和描述是否完备是否清晰地说明研究如何进行的?
样本
取样过程是否具有代表性?
样本来源以及取样过程是否清晰?
该研究被试与以往研究被试的相似程度如何?
结果和讨论
是否联系文献回顾对研究结果进行讨论?
研究结果与假设是否相关?
研究结果的讨论与实际是否一致?
参考文献
引用文献是不是最新研究?
引文格式是否符合要求?
文献是否全面?
研究报告的总评
是否条理清晰易于理解?
长处和不足?
研究的主要含义?
文献综述的写作6
阅读其他文献综述创立一个贯穿整个综述的统一主题或思考主线系统化的组织材料制定写作提纲在你所综述的不同类型文章之间建立联系练习也许不能带来很好的结果,但是对你绝不会有坏处
伦理学研究的基本原则7
避免伤害
保护隐私
强制
知情同意
保密原则
合理欺骗
利益共享遵循伦理准则的有效措施7电脑模拟构建一个电脑模拟系统危险、自然当一种处理被认定为是有危险的时候,尝试寻找已经被某些变量伤害了人群作为被试知情时刻保持知情同意,如果实验处理存在风险,必须确认参与者以及其他相关人员清楚地知道这些风险。
不用个人数据小样本试验
复查计划审查委员会在线调查的伦理规范44:
取样和概化总体和样本总体是一组潜在的参与者,你想要通过他们来们概括研究结果。
样本
是总体的一个部分,或称一个子集
概率取样
总体中每一个对象被选择的可能性是已知的。
简单随机取样过程
界定总体
界定你想从中选择样本的总体。
列出对象
列出总体中的所有对象排列序号为总体中的每一个对象排列序号。
选择样本使用标准和准则来选择你想要的样本方法:
随机数字表电脑生成系统取样即在列表中每隔k倍个名字选择样本,k代表一个从零到研究者计划抽取的样本大小的数值分层取样
取样理论
如果能够抽取到一个总体中最具代表性的样本,那么关于该样本所做出的任何评论都同样适用于该总体。
推广度越远越好。
整群取样
是指选取由个体组成的单元,而非个体本身。
非概率随机取样抽取单个个体的概率是多少并不知道方便取样法定额取样法选择具有你想要的特性的人,但不是随机的从所有这样的孩子的总体中选择一个子集。
样本,样本量和样本误差
取样目的
基于最少的样本来推论总体
取样误差
样本特征和抽取出该样本的总体特征之间的差异
样本容量的意义
容量越大,误差越小,质量越高一般来说,样本容量越大,取样误差越小,你所做研究的质量就会越高足够被试如果你的研究需要多个分组,那么你要保证抽取足够多的被试以至于可以将其最终分配到各个分组中去邮寄当你采用邮寄调查或问卷调查的方式收集数据时,要考虑增加百分之40到50的样本容量,因为有一些调查或问卷会被遗失,或是没有被填写。
精确而恰当的样本样本容量大固然好,但是选择一个精确而恰当的样本更好
5:
信度和效度
测量水平可代表所测量变量的精确程度的等级,可以通过他对变量加以评估。
称名测量
简单把人分到ab两类,
定义称名是用来描述那些属于自然范畴,在质上而不是在量上有差别的变量。
你所测量的变量要能描绘你的观察结果的特性,以便于你能将其归于某一类而且仅仅是这一类。
特点
独立各个类别是彼此独立的只有类别意义如果数字被用来赋值,那么他们除了用于类别之外没有别的意义。
顺序测量把人们分到标有一定维度的不同组去。
高矮组定义顺序测量用来描述那些可以根据某一连续体来排序的变量,这些值不仅可以归入某一类,而且可以对他们进行排序。
等距测量我们不仅知道这两组之间有差别,而且能准确的知道这一差别的程度。
定义它是用来描述在变量之间有相等的距离。
等距变量允许我们根据在顺序测量中提到的同一个连续体来判断点与点之间不同。
比率测量物体和人的高度,用一个有绝对零点的量尺来测量。
定义用来描述在其值之间有相等的间距,并且有一个绝对零点的变量,这表示某一变量的值可能为零,或者这一变量的特性真的不存在。
测量水平的三个概念
普适任何研究设计中,变量的结果适用于这四种测量水平的任何一种,当然关键在于变量是怎样被测量的。
向下包含某个测量水平所具有的品质,也是更高测量水平所具有的特点。
精准测量水平越精确,测量过程就会越准确,你就越能测出你所感兴趣的东西的真实结果变量类型
连续变量是在某一连续体上,可以是任何一个值的变量。
离散变量就是那些只能被归入某一有明确界限的类别中的变量。
信度
定义信度就是对某一事物进行多次测验,其测验结果都是相同的。
观测值
是真实记录或观测到的分数。
观测值=真分数+误差分数真分数是在没有其他额外变量影响的情况下,对某一变量真实值的反应。
真分数只是理论上的一个概念,在实际测量中是无法得到的。
误差分数是造成真分数和观测值产生差异的各种因素的综合。
组成
方法误差测量方法上的误差,使真分数和观测值产生差异的是测验情景。
特征误差造成真分数和观测值不同的是参加测验的被试特征。
提高信度的方法7增加题目或观测值的数量剔除,表达不清的题目实施测验的环境要标准化测验的难度要适中减少外部事件的影响测验工具标准化评分方法要一致
信度的测量相关系数r信度系数(-1,1)零或小于零说明没有信度。
通常在0.8到0.9之间。
信度的分类重测信度就是用来说明一个测验随着时间的变化有多稳定。
平行/等价复本信度这种信度让同一组被试做同一测验的不同形式的副本,然后求这两组数据的相关评分者信度评分者信度就是测量不同的评分者之间评分的一致性,而不是时间与时间,复本与复本之间的一致性。
内部一致信度内部一致性度是用来检测一个测验中的项目之间的一致程度。
效度一个测验是可以有信度而没有效度的定义与三个重要方面效度是说明一个测验结果的效度,而不是某个测验的效度。
像信度一样,效度也并非是全或无的问题。
一个测验结果的效度必须在该测验实施的环境下解释。
类型内容效度内容效度说明一个测验在何种程度上代表了测试项目的总体。
效标效度就是检验某一测量的测验结果与校标的相关程度。
同时效度说明一个测验对当前绩效估计的有效程度。
预测效度说明一个测验对将来绩效的预测程度。
结构效度定义一个测验的结论对某一潜在的心理结构的说明程度。
确定方法3与已有测验的相关像校标效度一样,可以探寻所编制的测验和某些已经确定有很好的结构效度的测验之间的相关。
有与没有的差异可以通过证明拥有某一特性和没有某一特性的被试,在新编制的测验中的得分上是有差异的来确定其结构效度。
理论依据可以分析一下测验题目有哪些
任务要求,然后看一下这些任务要求与用来编制某一测验所依据的理论是否一致。
多质多法矩阵测量结构效度这种技术使用多种方法测量多种特性,所预测的结果就是无论用哪种方法测试这些特性,他们彼此之间都是相关的。
聚合效度方法和方法之间是相容的区分效度不同的方法和特性之间是不同的6:
行为测量法
为什么要使用测验5获得结果,判别有效性,评估水平最重要的一点,测验可以帮助研究者获得实验的结果,通过测验可以判别实验的有效性,或者评估如高度、投票意向等变量的水平。
诊断工具测验,可以作为诊断工具了解个体的优势和劣势。
配置的依据测验可以作为配置的依据。
协助选拔测验可以协助选拔评估程序测验用来对程序的结果进行评估,除非你搜集到问题的相关信息,并对信息进行分析,否则你永远不会知道你所评估的程序是否有效。
如何选择和实施测验7纸笔形式或是其他?
行为本质是什么自我报告还是观察时间限制主观还是客观个体还是团体选择还是自填测验的类型
成就测验
定义
用来评估某一具体领域的知识,它是最常用的测验类型分类
两种基本型
标准化测验有标准的指导语和评分程序研究者自编测验其他类
常模参照测验可以将个人的成绩与其他人的成绩进行比较标准/内容参照测验有一个具体的成绩水平或者标准选择题结构
题干干扰项选项项目分析
难度D公式
区分度d公式p122高低分组27%态度测验态度测验主要评估个体对于人、事、物的感受,通常使用态度测验来了解某人对某件具体事情的感受瑟斯顿量表/等高间距法等距测量开发步骤4
陈述的题项越多越好。
专家排序对某个领域有一定了解的专家按照最不支持到最支持的顺序将这些陈述语句分为11个等级,6为中立
计算平均分评判者将具有一致性的陈述按照其所处的等级来计算平均分值。
语句排列一组陈述的语句在你的态度量表中将按照最不支持到最支持的顺序进行排列李克特量表/累加评定法广泛使用
开发步骤陈述语句表达了个体对人、事物的观点和感受。
所选择的语句应当能够反映支持和不支持的态度。
在陈述语句列表的右边有同意和不同意的选项供被试选择
人格测验是用来评估个体稳定的行为模式的常用测验类型投射测验(非结构化)投射测验给被试呈现一些模棱两可的刺激,然后要求被试对这些刺激进行反应。
TAT主题统觉测验
罗夏测验
结构化测验更为客观,易于评分;
结构化测验一般要求被试对那些描述他们自身感受的项目表示赞同或者反对。
卡特尔的16项人格类型测验
(16PF)
明尼苏达多项人格测验(MMPI)观察法
分类
现场观察法
自然观察法
行为记录法
持续时间记录研究者使用记录时间的仪器来测量行为发生的时间有多长频率记录该方法主要就是记录某一行为的发生率和频率。
时距记录/时间取样这种方法主要在某个特定的时间段对被试进行观察连续时间记录记录被试的所有行为,不太关注某一具体的行为。
观察法使用的问题4影响被观察行为你的观察可能会影响你要观察的行为观察者偏见、观点你自己的偏见或观点可能会影响你对所观察行为的选择,以及记录行为的方式。
问卷法
观察者劳累、厌烦你可能会因变得劳累或者厌烦而漏记了一些行为,或者行为的重要方面。
改变定义你可能会改变所要观察的行为的定义。
优点3
通过邮局邮寄问卷或者发电子邮件,你可以进行大范围的区域调查。
问卷法比一对一访谈要便宜。
人们更愿意说实话,因为问卷法可以保证匿名信。
问卷的组成p130问卷的基本假设5问题本身3问卷的格式8附函9
7:
数据收集和描述统计
收集步骤4
构建一个数据收集表来组织你收集的数据。
运用编码策略为数据收集表中的数据命名或赋值。
把收集到的数据集中起来把数据输入数据收集表中收集过程
建构数据收集表
构建数据收集表的一般建议7p137一个被试分配一行。
一个变量分配一列。
使用有列或者有格子的纸。
被视的序号记录成行,分数或者其他变量记录成列。
为你想要收集或者在未来的研究中预期要记录的数据留下足够的空间。
当数据收集完成后请将其备份并保存在其他地方,以防原始数据或其他收集到的数据损坏或遗失每完成一个表格都要为他注明日期,并以首字母命名。
使用光学扫描仪收集数据
好处
加快评分进程。
光学扫描仪比人工记分更准确。
光学扫描仪还可以帮助分析每一个项目的属性。
数据编码数据收集的十条建议获得审查委员会允许。
当你思考如何设计你的研究过程时,也开始思考你将收集何种类型的数据来验证假设。
当你思考你将要收集的数据类型时,请同时考虑你将通过哪些途径获得数据。
确保你要使用的数据收集模式是简洁易用的当你将数据输入到数据输入表中后,请将其备份并保存在不同的地方。
在收集和转录数据时,不要依赖任何人制订一个详细的日程表来分配你将收据数据的时间和地点。
尽可能拓宽你可能的数据来源。
试图去联系那些错过了测验或者是访谈的被试。
永远不要丢弃原始数据,如测验问卷访谈记录等原始资料。
描述统计可以对你所收集到的数据分布的一些特征进行描述。
推论统计
你所收集到的数据是否可以证实你的原始假设,如何将你的研究结果推广到更多的人中,而不仅仅是参与测试的被试。
分数分布比较数据分布差异的方法集中量数/平均数p143是一组数据集中程度的代表,并且是最能代表一组数据或其分布的值。
算术平均数
将所有的数据累加,再用这个数据的个数,去除数据的总数。
称名变量中数
按顺序排在一起的数据中居于中间位置的数。
顺序变量众数
次数分布中出现次数最多的那个数的数值。
等距或比率变量差异量数
离中趋势
离中趋势是指数据分布中数据彼此分
散的程度
全距是把一组数据按从小到大的顺序排列,用最大值减去最小值所得的数。
标准差是数据分布中所有原始数据与平均数绝对离差的平均值。
分布特征正态分布曲线z分数z分数能够表示原始分数在数据分布中的相对位置。
标准分数是针对那些有相同的参照点和相同的标准差的数据而言的,出现频率最高的标准分数为z分数。
z分数是原始分数与该组数据的平均数的差除以标准差,所得到的结果,即表示原始分数在平均数上下几个标准差的位置。
标准分数最大的价值在于它可以比较不同数列中数据之间的差异性。
8:
统计推论根据样本的描述性特征来推断样本所来自的总体的相应信息的一种方法
什么是偶然性偶然性就是产生了变异,而这种变异却无法利用你所研究的变量进行解释中心极限定理不管总体分布形状如何,从总体中抽取的所有样本的平均数的分布都将是正态分布统计显著性就是你愿意冒风险的水平,也就是当虚无假设正确时,你却拒绝他所犯的错误概率
1类错误
不接受正确的虚无假设。
2类错误
接受了错误的虚无假设。
显著性检验
推论统计最大的优势是可以根据样本信息对总体信息作出推断,统计显著性检验是实现推论的最有用的方式之一。
过程8
提出虚无假设。
设置虚无假设的风险水平。
选择恰当的统计检验方法计算检验统计值。
使用特定统计量的统计临界值确定拒绝虚无假设所需的值。
比较获得值与临界值如果获得值远远超出临界值,那么虚无假设不可能被接受。
如果获得值没有超过临界值,那么虚无假设就是最有力的解释。
独立样本平均数的t检验是一种常用的两群体独立的不相关的平均数之间差异的显著性检验。
多元方差分析是一种检验在多因变量中发生的组间差异的先进技术。
因素分析是另一种先进的技术,它允许研究者减少代表某一概念的变量的数目,用得分较高的因素作为因变量。
统计显著性的重要结论显著性本身或内部是无意义的,除非所执行的研究具有合理的概念基础,可以由此推导结果显着性的意义。
统计显著性不能脱离发生的背景独立解释。
虽然统计显著性是很重要的概念,但是他并不是终极目标,当然也不应该是统计研究的唯一目标。
元分析
步骤4收集尽可能多的或是尽可能代表某一主题的研究。
研究的结果需要被转化成某一个共同的度量标准,以使他们可以彼此做比较。
在众多元分析中所使用的度量标准就是
所谓的效应量研究者会发展出一套系统来编码研究的
各种维度,包括被试的描述、所用的干
预类型、所选的研究设计、结果测量的
种类和初始研究的作者所得出的结论。
总的来说,有各种描述和相关技术用来检验研究的结果。
9:
非实验研究:
描述性和相关性研究
与比较/实验研究的区别
调查研究/取样调查
访谈
问题类型
结构化问题(封闭式的)问题需有清楚明确的焦点,并且需要给予明确的回答。
非结构化问题(开放式的)
优点3缺点3
灵活关注更多便利费时匿名性差
不标准
访谈十诫
不能冷淡获取信息坦率和直接安静场所复述录音重要性练习询问
调查研究的实施流程4
澄清研究目标
确定样本
确定方法编码和计分
评估调查研究优3缺3宏伟的构思高效精准资源偏差回答偏差不予回应
相关性研究描述两个或者更多变量间的线性关系,而不涉及将一个变量的效应归因于另一个变量。
相关关系
相关系数(定义)皮尔逊积差相关系数10:
质性研究法
质性研究定义
研究资源
文献资料
档案记录
实体文物
直接观察
参与观察
焦点小组
个案研究
优3
专注一件事使用不同技巧丰富充分的信息
缺5
不一定真实
可能会被偏见影响
广度不够
不能建立因果联系概化程度有限
民族志
特点3
全面
自然主义
同时提出假设和结果
历史研究
步骤6
定义主题
以问题的形式阐明假设需要利用多种资料评估真实性数据库整合结果解释局限性3
普遍性存在局限研究资料经常被质疑长期而艰巨11:
前实验与真实验研究方法实验设计类型
随机的三步
总体中随机选择
随机分配被试决定哪一组被试接受实验处理前实验设计既没有从总体中随机选择被试,也没有包含控制组,因此该研究在揭示自变量与因变量之间的因果关系时,说服力虽然没有完全消失,但却大大减弱了。
单次个案研究设计3步单组前后测设计4步真实验设计
前后测控制组设计4步
单后测控制组设计3步2不足所罗门四组设计准实验设计/因果比较实验设计内部效度、外部效度与实验设计内部效度是指实验设计的质量,诸如操纵的自变量对研究结果的解释程度。
外部效度是指实验设计的质量,诸如来自某一样本的研究结果能够普遍化到其他样本的程度。
内部效度的影响因素7历史成熟被定义为是由于生理或心理力量作用而促成的改变,这些改变可能会掩盖实验处理结果。
被试选取测验测量统计流失率
外部效度的影响因素4
多重处理干扰
反作用安排
实验者效应
前测敏感性
提高内部效度的方法随机的从总体中抽取样本,随机的将被试分配到组中,并设置控制组。
提高外部效度的方法外部效度取决于研究者本身的行为方式而不是研究设计。
研究者只有通过控制自身的言谈举止才能有效减少影响实验外部效度的大多数因素。
无关变量的控制
无关变量指的是那些会降低研究内部效度的因素,如果不以某种方式加以控制,那些变量就会混淆研究结果。
减小对实验结果影响的做法2选择忽视随机化
减小对实验结果影响的方法3
匹配
如果实验组的被试在某测验上的得分为x,那
么研究者要确保控制组的被试有相类似的得分。
同质群的运用协方差分析