第三章-描述性研究.ppt
《第三章-描述性研究.ppt》由会员分享,可在线阅读,更多相关《第三章-描述性研究.ppt(120页珍藏版)》请在冰点文库上搜索。
第三章描述性研究,DescriptiveStudy,南京医科大学公共卫生学院流行病与卫生统计学系地址:
南京市天元东路818号公卫楼电话:
86-25-86868437(o)电邮:
马红霞,流行病学的定义流行病学是研究疾病与健康状态在人群中的分布及其影响因素,借以制订和评价预防、控制和消灭疾病及促进健康的策略和措施的科学。
疾病频率测量的指标发病(发病率、罹患率、续发率、患病率);死亡(死亡率、病死率、生存率)流行病学的研究方法观察性(描述性和分析性)、实验性和理论性研究,如何了解江苏省自然人群糖尿病的分布特点?
2.如何研究空气污染和人群健康的关系?
概述,疾病分布的描述,生态学研究,讲课提纲,现况调查,描述性研究,又称描述流行病学(descriptiveepide-miology),指利用已有的资料或特殊调查的资料包括实验室检查结果,描述疾病或健康状态在不同地区、不同时间及不同人群中的分布特点,为进一步开展分析流行病学研究提供病因或流行因素的线索,即提出假设。
属观察性研究,是流行病学研究的基础步骤。
第一节概述,概念,它主要描述分布的三大特征,即:
地区特征、时间特征和人群特征,“三W”。
描述性研究一般不需要事先设计的对照组,所收集的资料也相对地较为粗糙和广泛。
它不能分析暴露与效应之间的因果联系。
特点:
现况调查(横断面研究)生态学研究(相关性研究)个案调查、病例报告和病例分析,分类,描述性研究,描述疾病及其影响因素分布规律。
形成初步假设。
发现早期患者。
提供基线数据。
评价预防控制措施的效果。
用途:
第二节疾病分布的描述,“三间分布”,WHO人群分布WHEN时间分布WHERE地区分布三间分布的综合描述,疾病分布(Distributionofdisease)是指在不同人群、地区和时间特征上发生的情况,是疾病的群体现象,可通过发病和死亡等频率指标来描述。
一、人群分布(distributionbypopulation)who?
年龄性别职业行为种族/民族家庭,1、年龄年龄是人群分类的重要特征标识,也是描述疾病在人群中分布的重要因素。
大多数疾病的发病率或死亡率都与年龄有关。
死亡率:
11,发病率:
幼年型大多数传染病,也称儿童传染病,如麻疹、脊灰等。
青壮年型血吸虫病、淋病、爱滋病等。
高年型胃癌、乳腺癌、冠心病、脑卒中等。
幼年高年型一些呼吸道疾病,如肺炎、上呼吸道感染等。
特点:
年龄与疾病间的关联比其他因素的作用都强,多数疾病的发病率与死亡率均与年龄变量有关。
慢性病随年龄增长发病率有增长趋势。
急性传染病随年龄增长发病率有减少趋势。
年龄分布差异的原因(总的思路)
(1)免疫水平状况的差异
(2)暴露危险因素的机会不同预防接种可以改变某些疾病固有的年龄特征研究疾病年龄分布的目的
(1)分析疾病不同年龄分布的差异
(2)提出重点保护对象及确定高危人群(populationathighrisk),疾病的年龄分布的分析方法
(1)横断面分析(cross-sectionalanalysis):
某特定时间内对各年龄组人群的发病率、患病率或死亡率进行描述。
说明同一时期不同年龄疾病分布变化,以及不同时期各年龄疾病分布变化,主要用于急性病或病程短的疾病。
缺点:
不能正确显示慢性病的致病因素与年龄关系因为暴露时间距发病时间可能很长,而且致病因子在不同时间的强度可能有变化,横断面曲线每一条曲线代表的是不同时间出生的人口在同一时点上的死亡率,
(2)出生队列分析(birthcohortanalysis):
对同一年代出生的人群进行随访,观察他们在不同年龄阶段某病的发病、患病和死亡情况进行分析。
将疾病年龄分布和时间分布结合起来描述主要分析下列三个方面的作用:
年龄本身时期(时代)特点暴露经历,出生队列曲线每一条曲线代表的是同一时间出生的人口在不同时点(不同年龄)上的死亡率,19141950年男性肺癌年龄死亡专率(byMacMahon),A、B、C、D为1880年出生人群的死亡队列,年龄组(岁),1850-1890间出生者男性肺癌队列死亡率(byMacMahon),年龄组(岁),横断面曲线不同时间出生同一时点,出生队列曲线同一时间出生不同时点(不同年龄),疾病本身固有的年龄分布特征某时点上特殊事件的影响(例如:
疾病的爆发、流行)不同出生队列人口自出生至该时点间的经历,横断面分析得到的年龄分布特征结果:
假象,横断面分析+出生队列分析,
(1)比较两个不同人群的发病率、患病率或死亡率时,一定要考虑年龄构成不同所造成的假象。
年龄专率比较或标化率比较。
(2)年龄经常作为流行病学研究匹配的主要因素之一,以避免年龄造成的混杂作用。
注意的两个问题:
2、性别探讨两性疾病率的不同有助于探索致病因素。
暴露机会不同是重要的环境因素。
生理、解剖等生物属性不同是造成男女发病不同的首要原因。
两性生活方式、嗜好不同导致疾病的性别分布差异。
除卵巢癌、宫颈癌外,男女皆患的癌症:
男性女性胆囊炎、胆石症和地方性甲状腺肿等:
女性男性。
传染病:
则随接触机会不同而变。
美国12种主要死因年龄调整死亡率性别比,3、职业,职业中暴露于不同的物理因素、化学因素、生物因素及职业性的精神紧张均可导致疾病分布的不同。
“现代文明病”(thediseasesofmodernization)“生活方式疾病”(thediseasesoflifestyles)最常见的不良行为方式有:
吸烟、酗酒、吸毒、不正当性行为、静坐生活方式等。
4、行为,5、民族或种族民族、种族的遗传因素不同民族间的社会经济状况不同民族间风俗习惯、生活习惯和饮食习惯不同各民族定居点的地理环境、自然条件及社会条件不同民族、种族的医疗卫生质量和水平不同6、家庭聚集性传染病:
探索传播途径、传染源非传染病:
探索环境和遗传因素的影响,中国部分少数民族食管癌死亡率,二、疾病的时间分布(distributionbytime)when?
疾病的时间分布有四种类型:
1、短期波动(rapidfluctuation)也称“时点流行”,与“暴发”相似。
定义:
疾病在某一集体或固定人群中,短时间内发病数突然增多。
原因:
多半由于许多人短期接触同一致病因子引起。
形式:
发病有先后;潜伏期有长短。
常见疾病:
食物中毒、伤寒、痢疾及甲型肝炎等。
2、季节性(seasonality)也称“季节波动(seasonalvariation)”。
形式:
严格季节性多为虫媒传染病,如乙脑季节性升高肠道传染病、呼吸道传染病,四省市流行性乙脑季节分布,3、周期性(periodicity,cyclicchange)定义:
一些传染病相隔若干年发生一次流行,并具有规律性,称为周期性。
多见于呼吸道传染病。
如麻疹在计划免疫前隔年流行流感10-15年流行一次条件:
(1)新生儿的增加、易感者积累的速度快
(2)传播机制容易实现(3)存在较稳固的病后免疫,保定市19501988年流行性脑脊髓膜炎发病率,有效的预防措施可以改变疾病的周期性规律,4、长期变异(变动)(secularchange)或称长期趋势定义:
疾病的感染类型、病原体种类及其宿主在相当长的时间内随着人类生活条件的改变、医学技术的进步、自然条件的变化而发生显著变化,称为长期变异。
原因:
(1)病因或致病因素发生改变
(2)传染病病原体的生物学变异(3)诊断水平的提高(4)登记报告制度的完善(5)人口学特征的改变,1930-1999年美国男性肿瘤死亡率,三、疾病的地区分布(geographicdistribution)where?
地区划分方法行政区域划分自然环境特征划分描述方法统计表统计图:
标点地图、疾病地区分布图、疾病传播蔓延图,疾病在不同国家及同一国家不同地区的分布,疾病在不同国家的分布,有些疾病仅发生于某些地区有些疾病虽在全世界均可发生,但不同地区的分布各有特点日本的胃癌及脑血管病的调整死亡率或年龄死专率居首位肝癌多见于亚洲、非洲乳腺癌、肠癌多见于欧洲、北美洲,不同国家乳腺癌调整死亡率1964-1965,女性,不同国家胃癌调整死亡率1964-1965,男性,疾病在同一国家内的不同地区分布,血吸虫病仅限于南方一些省份鼻咽癌广东,故有“广东瘤”之称食管癌河南林县肝癌江苏启东原发性高血压北方南方,疾病的城乡分布,42,
(1)概念:
由于自然环境和社会因素的影响而使一些疾病,包括传染病和非传染病,常在某一地区呈现发病率提高或只在该地区存在,这种状况称为地方性。
自然疫源性:
自然疫源性疾病自然疫源地森林脑炎统计地方性:
生活习惯、卫生条件或宗教信仰等社会因素自然地方性:
该地区有适合病原体生长发育或传播媒介生存的自然环境或特有的微量元素分布不均等自然地理环境,如血吸虫病、地方性甲状腺肿,地方性疾病(简称地方病)(endemicofdisease),四、疾病地区/时间/人群分布的综合描述,地区和时间分布的综合地区和年龄的综合时间和年龄分布的综合移民流行病学,移民流行病学migrantepidemiology概念:
观察某种疾病在移民人群、移居国当地人群及原居住地人群中发病率、死亡率的差别,以探索该病的发生与遗传和环境因素关系的一种研究方法。
若环境因素是主要因素移民原居住地人群发病率或死亡率移民移居地当地居民若遗传因素是主要因素移民原居住地人群发病率或死亡率移民移居地当地居民,日本人、在美国的日本移民、美国白人一些死因的标化死亡率比(1959-1962),第三节疾病流行的强度,也称疾病的“社会效应”。
强调发病数量的变化和病例间的联系强度,常用的术语有:
1、散发(sporadic):
指某病在一定地区的发病率呈历年来一般水平。
或者某病发病人数不多,病例间无明显的相互传播关系。
一般适用于较大范围的地区。
理解:
“历年来一般水平”一般参照当地的前三年该病的发病率。
散发的原因:
对传染病来说该病常年流行,居民有一定的免疫或免疫水平;隐性感染为主的传染病,如乙型肝炎;传播机制比较难以实现的传染病,如狂犬病;潜伏期长的传染病,如乙型肝炎。
应用:
一般适用于较大范围的地区,2、流行(epidemic):
指一个地区某病发病率显著超过历年的散发发病率水平。
说明存在促进发病率升高的因素引起注意。
理解:
“显著”的实质是统计学检验具有显著意义。
疾病的流行和散发是相比较而言的,只能用于同一个地区、同一疾病历年来发病率之间的比较。
大流行(pandemic):
某病的流行在短期内越过省界波及全国甚至超出国界、州界,形成世界性大流行。
例如:
流感全球大流行,3、爆发(Outbreak):
在一集体单位或小居民区短时间内突然发生许多病例的现象。
理解:
短时间主要指在该病的最长潜伏期内,爆发往往通过共同的传播途径感染或由共同的传染源所引起,如集体食堂的食物中毒、托儿所的麻疹暴发流行等。
第四节现况调查,PrevalenceSurvey,按照事先设计的要求在某一人群中应用普查或抽样调查等方法收集特定时间内疾病或健康状况及有关变量的资料,以描述该疾病或健康状态的分布及与疾病分布有关的因素,又称横断面研究(cross-sectionalstudy)。
现况调查的概念,现况调查现患研究患病率研究,横断面研究设计原理示意图,现况研究的目的,1、描述疾病或健康状况的三间分布情况。
如:
AIDS在中国的现况、高血压、糖尿病、肿瘤2、描述某些因素或特征与疾病或健康状态的联系,提出病因假设。
如:
冠心病的发病因素3、评价防制措施的效果。
如:
评价疫苗接种效果4、筛查出高危人群,从而达到早发现、早诊断和早治疗的目的。
如:
高血压的普查、糖尿病普查、乳腺癌普查,现况调查的特点,常用的流行病学调查方法一般不设立对照组,对于暴露和疾病同时进行调查,资料处理和分析时再分组时序上属于横断面研究特定时点或期间,探讨某一时点研究对象的状况或不同变量间的关系确定因果联系受限疾病与相关因素同时存在,无法判断其先后,只能做相关分析病程短的患者难以纳入研究病程短的疾病,患者可能发生死亡或痊愈,难以反映疾病全貌。
现况调查的种类,普查(census)抽样调查(samplingsurvey),普查(census)是指为了了解某病的患病率或健康状况,在特定时间范围内,对一定范围的人群中每一成员进行的调查或检查。
普查,概念,目的,早期发现、诊断和治疗病人。
了解疾病或健康状况的分布。
优点能发现普查人群中全部病例,并给予及时的治疗能对该地区某病的全貌有一个了解通过普查可进行一次广泛的医学科普宣传局限性不适于患病率低和检查方法复杂的疾病调查普查对象多,难免漏诊、误诊工作量大,很难进行深入细致的调查,适用条件要明确普查的主要目的,是为了早期发现病例并给予及时治疗。
二级预防(secondaryprevention)普查的疾病最好是患病率比较高的,以便短时间内调查能得到足够的病例。
普查应具备灵敏度高、特异性强且易于在现场实施的检验或检查的方法。
要有足够的人力、物力和财力支持进行普查。
概念:
指在特定时点、特定范围内某人群总体中,按照一定方法抽取一部分有代表性的个体组成样本进行调查分析,以此推论该人群总体某种疾病的患病率及某些特征的一种调查。
基本原理:
代表性取决于随机化样本大小,抽样调查(samplingsurvey),优点可以通过“样本”来代表和说明总体节省人力、物力和时间调查的精确度高局限性非全面的调查方法设计、实施与资料分析比较复杂不适用于变异过大的材料和患病率太低的疾病,抽样调查的优缺点,单纯随机抽样(simplerandomsampling)系统抽样(systematicsampling)分层抽样(stratifiedsampling)整群抽样(clustersampling),多级抽样,抽样方法,单纯随机抽样(simplerandomsampling),先将研究对象编号,再用随机数字表或抽签、摸球、电子计算机抽取等进行抽样。
优点:
实施简单、易理解;最简单、最基本的抽样方法缺点:
抽样范围较大时,工作量太大难以采用;当抽样比例较小而样本含量小时,所得样本代表性差。
原则:
总体中每个对象被抽到的概率相等,单纯随机抽样(simplerandomsampling),EpiCalc2000,系统抽样(systematicsampling),按照一定顺序,机械地每隔一定数量的单位抽取一个单位。
又称间隔抽样或机械抽样。
将总体各个个体单位按某种标志排列、连续编号根据总体数N和确定的样本数n,计算抽样距离(K=N/n)用单纯随机方法在第一组中确定一个起始号从此起始点开始,每隔K(K=N/n)个单位抽取一个作为研究对象,研究人群累计单位数,从1200人(户)中随机抽取12人(户),等分为12个抽样间隔,从第一个抽样间隔中的随机起点开始,系统抽样(systematicsampling),优点:
简单易行;样本观察单位在总体中分布均匀,抽样代表性较好。
缺点:
如果各单元的排列顺序有周期性,则抽取的样本可能有偏倚。
分层抽样(stratifiedsampling),先将研究对象按主要特征(如年龄、性别、职业、教育程度等)分几层,然后再在各层中进行随机抽样。
各层内变异越小越好,各层间变异越大越好。
主要是用于从分布不均匀的研究人群中抽取有代表性样本的方法。
总体,层,层,层,可按地区、年龄、性别、种族、教育水平等分层,在各层内再单纯随机抽样,分层抽样(stratifiedsampling),利用现成的集体,随机整群抽取集体单位,加以研究,由此推断总体的情况。
优点:
便于组织,节约人力、物力,抽样和调查比较方便。
缺点:
抽样误差较大单纯整群抽样(Simpleclustersampling)被抽到的群组中的全部个体均作为调查对象二阶段抽样(Twostagessampling)通过再次抽样后调查部分个体,整群抽样(clustersampling),整群抽样(clustersampling),社区、班组、班级等,不同的抽样方法从同一总体中抽取含量相等的样本。
一般来说,四种方法的抽样误差大小如何排序?
各种概率抽样方法比较,设计模式,现况研究的设计与实施,一、明确调查目的此次调查要回答什么问题?
现况调查设计与实施要点,描述分布,进行社区诊断?
提出病因假设?
评价防治效果?
二级预防(早发现?
早诊断?
早治疗?
)提供基线资料?
掌握有关背景资料对该问题已了解多少?
有三种途径:
既往经验总结征询有关专家意见查阅国内外文献,才能阐明该研究的科学性、可行性、创新性才能估价其社会效益和经济效益,二、确定调查对象,研究总体是什么?
范围有多大?
如何抽样?
调查对象:
三、确定调查类型和方法,调查类型:
是普查?
还是抽查?
调查方法:
面访?
信访?
电话采访?
自填?
网络?
测量的指标和方法的确定,要获取哪些数据?
指标是什么?
测量的方法、标准如何?
疾病的测量暴露的测量,测量的指标和方法的确定,疾病的测量尽量采用简单、易行,灵敏度、特异度均高的诊断方法(技术)。
诊断标准要提前建立,要严格、统一。
诊断标准可进行评价,可比。
暴露的测量必须有明确的定义和测量尺度。
灵敏度、特异度均高。
研究单位之间的变异(一般用标准差s表示)调查人群中欲调查特征或疾病的个体所占的比例(也即暴露比例或患病比例)调查要求的精确度“容许误差”,即实际值和预期值差异的大小,d来表示显著性水准,由来表示,决定因素,四、估算样本含量,率的抽样(单纯随机抽样,符合二项分布),估算公式,P:
预期现患率,Q1Pd:
样本率与总体率之差,均数的抽样(单纯随机抽样,符合或近似正态分布),s:
标准差d:
容许误差,即精确度,单纯随机抽样预期患病率10%,允许误差1%,单纯随机抽样预期s3.38,允许误差0.5,“调查问卷”(Questionnaire)是流行病学调查最主要工具。
五、调查表的设计,如何设计?
取决于研究目的和分析手段的需要格式:
把拟收集的数据项目用恰当措词构成一系列问题内容:
包括一般项目(一般情况、识别项目)研究项目(研究变量)类型:
自填表问卷表开放式封闭式混合式,导言知情同意书(ICF)调查表的题目、编号一般项目社会人口学特征资料研究项目流行病学项目疾病史、遗传史、行为暴露史等。
临床体格检查项目实验室检测项目核查项目调查员签名、调查日期等填表说明,调查表的基本结构,调查表编写的基本原则,调查项目的确定调查项目顺序的编制调查问题的设计问题设计的形式,根据研究目的和手段确定变量的数目和具体内容。
各项目指标的定义要明确;尽量采用客观、定量或半定量的指标;指标的测量从技术上、经费上必须可行。
项目要精选,有针对性且重点明确;需要的项目一个也不能少,不需要的项目一个也不能多。
研究中的主要变量,不仅需要定性而且需要定量测量。
可成对设置一些高度相关或内容完全相同而形式不同的问题,检验调查表的信度。
调查项目的确定,调查项目按逻辑顺序与心理反应分类排列,符合调查对象的交流习惯。
可根据人们的思维方式,按事物的内容和相互关系以及事情发生、发展的先后顺序排列。
先设定容易回答的,后设定敏感的、不容易回答的问题。
先排列封闭式问题,后排列开放式问题。
检查信度的问题须分隔开来。
采用不同调查方式,调查表项目的顺序应有所区别。
调查项目顺序的编制,问题应简单明了,所用的语言通俗易懂,语句精练准确。
问题设计应避免诱导性,避免出现暗示或有固定倾向的问题。
调查指标尽可能地用等级划分或定量化,不能量化的指标应留出空间以便详细记录。
封闭式设问的选项设计必须具有科学性和严密的逻辑性。
对一些抽象性的概念或问题,最好给出一些具体的看法,让被调查者仅回答赞成与否。
对一些敏感性问题,可采用专门设计的调查表并采用特殊的调查技术进行调查。
调查问题设计的原则,问题设计的形式,二项式是1,否0多项式文盲=1,小学=2,初中=3,高中/中专=4,大专以上=5填空式出生日期:
年月日自由式矩阵式顺位式尺度式用药后你的疼痛程度:
不痛0|1|2|3|4|5|6|7|8|9|10很痛,调查表使用注意事项,调查表的使用必须伴有操作指南或使用手册,明确具体的质控措施。
正式实施前,可通过预调查或培训会对调查员进行统一的培训和考核。
填写调查表时,字迹要工整、清楚,不能缺项。
调查员和质控人员要签名,并注明调查和质控日期。
样本选取必须随机化应答率一般应高于80%-90%进行预调查统一培训调查员调查和检查方法标准化,且前后一致调查后复检,六、现况调查的质量控制,1.数据整理录入计算机前的检查、双轨录入计算机时的检查和统计分析前的检查某些变量需要分组、分级、编码等2.数据分析
(1)计算有关统计指标
(2)描述疾病或健康状态的分布患病率(3)分析性描述相关或关联分析、多因素分析3.结果解释,七、数据资料分析和结果解释,现况研究中存在着两类误差:
一类是由于抽样所产生的误差,即抽样误差,是不可避免的。
但我们可以通过严格的抽样设计、改进与完善抽样技术和认真地实施抽样方案,来尽量减少抽样误差。
通常,抽样误差是可以测量的。
一类是偏倚,属于系统误差,是可以设法避免的。
如果在研究中不能很好地控制偏差,则所调查的结果就是不可靠的,也就达不到调查的目的。
八、现况研究中常见的偏倚及其控制,指研究设计、实施、分析和推断过程中存在的对暴露因素和疾病关系的错误估计,它系统地歪曲了暴露因素与疾病间的真实联系,其本质是一种系统误差。
定义,偏倚(bias),1.选择性偏倚(selectionbias)是指在研究对象选择过程中所产生的系统误差。
通常包括以下几种:
选择性偏倚无应答偏倚(no-responsebias)存活者偏倚,现况研究中常见的偏倚,2.信息偏倚(informationbias)是指在收集资料过程中所产生的各种系统误差,使所获得的资料缺乏真实性和可靠性。
通常有以下几种:
调查对象所引起的偏倚调查人员所引起的偏倚测量偏倚,选择偏倚的控制方法严格按照抽样设计方案进行研究对象的选取,坚持随机化原则。
提高抽中对象的受检率和依从性。
在横断面研究中,要考虑幸存者偏倚的问题,尽可能病例选择面广一些,并注意收集有关病程、疾病类型方面的资料,以便在分析结果时,得出合理的结论,信息偏倚的控制方法为使调查对象能提供准确的信息,必须在调查问卷上下功夫。
对于调查员,关键是进行严格的培训,增强工作的责任感。
统一调查程序、方法。
测量仪器要选用标准一致的,不易产生偏性和稳定的仪器,使用前还要统一校正,从而保证测试结果的准确与可靠。
第三节生态学研究,EcologicalStudy,以群体为基本单位收集和分析资料,研究暴露与疾病或健康状况的关系,即用代表群体特征的量度来描述暴露与疾病或健康状况的关系。
群体:
学校、工厂、城市、国家等,概念,目的提供病因线索,产生假设评估人群干预措施,收集疾病或健康状态以及某些因素的资料时,以群体为单位,而不是以个体为单位。
描述某疾病或健康状态在各人群中所占的百分比或比数,以及有各特征者在各人群中所占的百分比或比数。
缺乏在人群中既有某病或某健康状态、又有某项特征的个体数据。
生态学研究的特点,生态学研究只是一种粗线条的描述性研究。
1.生态比较研究(ecologicalcomparisonstudy),生态学研究的方法,2.生态趋势研究(ecologicaltrendstudy),发病率或死亡率的比较相关因素的分布(暴露率),患病率或死亡率的变动趋势某因素的变动趋势,南方12省市血吸虫病发病率和大肠癌调整死亡率,r0.706,P0.01,r0.903,P0.001,浙江省嘉兴地区血吸虫病发病率和大肠癌调整死亡率,1.提供病因线索,尤其对某病或健康状态不很解时。
2.间接验证已存在的病因假设。
3.评价干预实验或现场实验的效果。
4.人群中变异较小和难以测定的暴露研究。
5.疾病监测工作中的应用。
生态学研究的应用,由于生态学研究是以由各不同情况的个体“集合”而成的群体为观察、分析单位,因而只能对暴露和疾病的关系进行粗线条的描述和分析