ImageVerifierCode 换一换
格式:PPT , 页数:81 ,大小:2.02MB ,
资源ID:18958978      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-18958978.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(医学研究的数据管理与分析——第一章-绪论.ppt)为本站会员(聆听****声音)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

医学研究的数据管理与分析——第一章-绪论.ppt

1、医学研究的数据管理与分析,Data Management and Analysis,目录,课程教学目标,能利用统计学的思维解决医学研究中遇到的问题;能够掌握EpiData、SPSS等软件的常规运用;能够进一步自学EpiData、SPSS等软件;提高医学研究数据处理和统计分析的能力。,课程教学计划,绪论调查研究基础数据管理 EpiData软件应用数据分析 SPSS软件应用表格数据分析 EpiCalc软件应用(自学)数据综合分析实际资料演练,主要参考书目,卫生统计学(第七版)方积亁 主编,人民卫生出版社,2012年8月。医学统计学(第五版)马斌荣 主编,人民卫生出版社,2008年6月。中医统计学(

2、第二版)申杰、王泓午等编著,科学出版社,2012年7月。医学科研中的统计方法(第四版)马斌荣 主编,科学出版社,2012年6月。临床医学研究设计和数据分析 赵耐青 主编,复旦大学出版社,2005年7月。医学科研数据的处理与分析方法 陈大方、陈常中 主编,北京医科大学出版社,2006年5月。医学统计学与SPSS软件实现方法 郭秀花、刘美娜等编著,科学出版社,2012年8月。,数据,决策,第一章 绪论,研究设计与数据的管理及分析数据类型与统计分析方法选择 数据管理和分析应遵循的原则,科学研究和研究设计,科学研究是通过实验或调查观察取得信息,并对其进行加工(如数据资料的统计学处理)的过程。科学研究的

3、核心是对未知事物的探索、观测和分析,生命力在于创新。用科学的观点和方法进行研究,其全过程应当是一个严肃的探索和思维过程,包括合理的假说、严谨的设计、严格的实验、严密的观测和正确的分析。,第一节 研究设计与数据的管理及分析,科研工作的基本程序(1),立题设计观察和实验资料整理和数据统计分析理性概括,科研工作的基本程序(2),研究设计的重要性,进行一项科研课题如同造一座大桥、一座大厦。如果大厦事先没有良好的设计就会倒塌,同样科研课题事先没有良好的设计就会失败。科研设计如同建筑设计一样举足轻重。研究设计的好坏,直接关系到研究结果的可靠信,任何设计上的缺陷,都不能期望事后弥补。,进行完试验后再找统计学

4、家分析数据,如同病人死后再找医生进行尸体解剖,医生会告诉病人死亡的原因是什么。同样,统计学家会告诉你试验失败的原因是什么。Ronand A.Fisher,1890-1962,研究设计:调查设计/实验设计 收集资料:准确可靠的原始资料 整理资料:核对/清理/纠错和量化 分析资料:统计描述/统计推断,统计学和流行病学在科研中重要性,调查研究设计,What to do?做什么?Why to do?为什么做?How to do?怎么做?(设计),Study design,(选题),搜集资料,整理与分析资料,调查(研究)项目,分析表(指标),研究目的,回答,统计分析步骤,调查研究步骤,解释、呈现结果,1

5、5,设计思路,研究设计思路与统计学分析步骤的关系,研究设计 专业设计 统计学设计,确定调查和研究的目的是选定研究指标的依据 研究指标又是研究目的的具体体现,一、明确调查和研究的目的,了解参数,用以说明总体。研究变量间的关系,通过确立统计学联系来 探索病因或验证疗效等。,16,二、确定研究对象和观察单位,研究对象:对象来源总体是什么?抽样方法:如何抽样?代表性?观察单位:个体?群体?,17,三、研究设计类型的选择,根据研究目的选择合适的设计类型:描述疾病的或健康状况的三间分布探讨病因验证预防和控制措施的效果评价疫苗的效果新药上市前临床试验,18,常用的实验设计方法,完全随机设计(complete

6、ly random design)配对设计(paired design)配伍组设计 随机区组设计(randomized block design)析因试验设计(factorial design)拉丁方设计(Latin square design)正交设计(orthogonal design)序贯设计(sequential design),20,现况(横断面)研究设计原理,普查抽样调查,抽样调查,总体,描述疾病或健康状况的三间分布情况,进行社区诊断(community diagnosis)。描述某些因素或特征与疾病或健康状态的联系,提出病因假设或提供病因线索。评价防制措施的效果。确定高危人群、筛

7、查出患有研究疾病的人群,从而达到早发现、早诊断和早治疗的目的。二级预防 为进一步流行病学研究提供基础。,现况研究的应用,病例对照研究设计原理,Time,Now,回顾性研究广泛探索病因,或初步验证病因假设。特别适用于罕见病的病因研究省力、省钱、省时间,易于组织实施同时调查多个暴露因素与疾病的关系,病例对照研究的应用和特点,队列研究设计原理,Time,前瞻性研究因果时间顺序明确,检验病因假说能力较强,可证实病因联系有助于了解疾病的自然史,并可获得一种暴露与多种疾病结局的关系研究费时间、费人力、费物力,队列研究的应用和特点,临床试验设计原理,四、确定研究项目,拟定调查表(问卷),调查和研究项目的确定

8、:分析项目、备选项目调查表和原始数据记录表的设计,29,调查表也称“调查问卷(Questionnaire)”,通过把拟收集的数据项目用恰当的措词构成一系列问题的“答卷”。调查表是医学研究资料收集的最主要工具。调查表如何设计取决于研究目的和分析手段的需要,关键在于保证所获得信息的准确性和可靠性。,四、确定研究项目,拟定调查表(问卷),第一类错误的概率:即检验水准,越小所需样本含量越多,对于相同的检验水准,双侧检验比单侧检验所需的样本含量更大,通常取0.05。把握度(power)1-,一般0.8-0.9单侧检验还是双侧检验,单侧检验所需样本量小,双侧检验所需样本量大。,五、样本含量的估计,31,五

9、、样本含量的估计,32,单纯随机抽样的样本量估计 实验设计的样本含量估计 流行病学研究的样本含量估计,讨论(一):如何估计样本量?,应用专门的公式和统计学软件估算,常用软件:EpiCalc 2000,33,常用软件:EPI INFO,34,常用软件:OPENEPI,35,直接观察法 采访法 包括面访、调查会及信访、电话访问等,六、原始资料的收集,原始资料的收集方式,36,面访,信访,电话,自填,其它,如internet,体检检查,实验室检查,敏感问题调查,资料的收集方法,37,七、调查和研究的质量控制,真实性(效度)可靠性(信度),偏倚如何控制?,如何评价?,录入前的核对 录入计算机,建立数据

10、库(database)Excel、Access、EpiData、STATA、SPSS、SAS软件等 录入后的核对和整理逻辑检查、核对 排序(sorting)建立新变量数据的编码和转换缺失值的处理,八、数据资料的整理,39,常用数据录入、管理软件,Visual FoxPro,FoxBase,Lotus等,常用数据分析软件,SAS,Stata,R等,医学研究的数据类型,定量数据(measurement data):连续型/离散型,特殊类型:两分类数据(dichotomic data),等级数据:有序分类/半定量名义数据:,定性数据(qualitative data),(计数资料),(计量资料),如

11、何描述和比较?,第二节 数据类型与统计分析方法选择,资料分析(DATA ANALYSIS),43,(1)统计描述(descriptive statistic)指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行描述。(2)统计推断(inferential statistic)指如何由样本信息推断总体特征问题。,医学研究的数据统计分析方法和指标,45,定量数据统计资料的描述,指标描述 集中位置:算术均数、几何均数、中位数、百分位数 离散程度:极差、标准差、方差、四分位数间距图形描述频数分布图 趋势图,定量数据,集中趋势的描述,算术均数几何均数中位数百分位数,46,定量数据,集中趋

12、势的描述,算术均数几何均数中位数百分位数,47,mean,最适于对称分布资料,特别是正态分布资料;对于偏态资料,均数不能较好地反映其集中趋势。,定量数据,集中趋势的描述,算术均数几何均数中位数百分位数,48,geometric mean,1.等比资料,如抗体平均滴度2.对数正态分布资料,定量数据,集中趋势的描述,算术均数几何均数中位数百分位数,49,Median 将一组数据按从小到大的顺序排列,位置居中的数即是中位数。,中位数常用于描述偏态资料,开口资料,有不确定值的资料的集中趋势;中位数和均数在对称分布上理论上是相同的。,定量数据,集中趋势的描述,算术均数几何均数中位数百分位数,50,Per

13、centile用于描述某个观察序列在某百分位置上的水平。,常用于确定参考值范围,亦称正常值范围。50%分位数就是中位数25%,75%分位数称四分位数(quartile),X%PX(100-X)%,定量数据,51,均数应用时的注意事项,均数适用于:单峰对称分布的资料几何均数适用于:对数变换后单峰对称的资料中位数适用于:任何分布资料,有不确定值的资料,定量数据,52,极差/全距(range)四分位数间距(inter-quartile range)方差(variance)标准差 SD(standard deviation)变异系数 CV(coefficient of variation),描述离散程

14、度的指标:,定量数据,53,极差/全距四分位数间距 方差 标准差变异系数,描述离散程度的指标:,极差(全距),描述数据分布的范围。极差大,说明数据分布较分散。方法简单明了。不灵敏。不稳定。,定量数据,54,极差/全距四分位数间距 方差 标准差变异系数,描述离散程度的指标:,四分位数(quartile)QU-QL下四分位数即第25百分位数,常用QL表示;上四分位数即第75百分位数,常用QU表示,定量数据,55,极差/全距四分位数间距 方差 标准差变异系数,描述离散程度的指标:,方差是实际值与期望值之差平方的平均值,而标准差是方差的平方根。,一般情况下,总体均数未知,需用样本均数估计,定量数据,5

15、6,极差/全距四分位数间距 方差 标准差变异系数,描述离散程度的指标:,变异系数CVcoefficient of variation,定量数据,57,集中趋势+离散趋势共同描述,均数标准差(min,max)中位数四分位数间距(min,max)变异度小,则均数代表性好!变异度大,数据分散,则均数代表性差!平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明计量资料的特征!,定量数据,假设检验两组或多组均数比较,58,定量数据,定量数据差别的统计意义检验小结,59,定量数据,两连续变量间的关系分析,直线回归和多元线性回归,相关分析,回归分析,Pearson相关,Spearman相关,6

16、0,定量数据,定性数据统计分析,统计分析,统计描述,统计推断,参数估计,假设检验,Example,分类资料,率、比、构成比,总体率的可信区间,2检验、u检验,定性数据,常用的相对数率 Rate构成比 Proportion比 Ratio,62,定性数据,定性数据统计描述,比可以是任意两个数值之比,包括比和比率。当分子是分母的一部分时,称为比例;当比例与观察时限有关时,称为率。比例又分为构成比和频率。而率与时间单位有关,即率有速率和强度的含义,它表示单位时间某事件发生的可能性大小。流行病学研究中常用的两个比是相对危险度和优势比(比值比)。,63,定性数据统计推断,定性数据,数据类型的转换,定量数据转换为定性数据一般比较简单,但从名义变量、等级数据转换为定量数据,则比较繁琐且损失数据信息。对两组或多组研究单项的某项指标进行统计学检验时,数据从定量转换为定性或等级数据时,统计学的效率会下降。,64,以正常参考值或临床诊断标准作为分组依据。某些定量指标尚无公认的正常参考值,可根据均数、中位数或三分位、四分位间距值,将其分为两组或多组。根据数据的分布特点和研究需要,自行确定,但要能对统计分析结果做

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2