横断面研究.docx
《横断面研究.docx》由会员分享,可在线阅读,更多相关《横断面研究.docx(15页珍藏版)》请在冰点文库上搜索。
横断面研究
横断面研究(Cross-sectionalstudy)的设计与分析
横断面研究是调查某特定人群在某时点的患病状况以及有关危险因素信息的一种研究形式。
又称患病率调查或现况调查。
横断面研究又根据是否调查所有研究对象分成普查(census)和抽样调查(samplingsurvey)。
目的:
1.流行状况和病因研究(疾病分布与危险因素的关系)
例如某县卫生局需决定县医院设多少肿瘤病床,是否投资购买CT和钴60机,做该县肿瘤病人普查。
例如在原发性高血压的普查中,调查了患有原发性高血压的病人和健康人的年龄、性别、家族史、吸烟和饮酒习惯、职业、体力活动和血脂等因素。
可以从以上因素中筛选出高血压的危险因素。
2.三早(早期发现、早期诊断和早期治疗),筛查(定期的重复横断面调查)
例如饮食业人员的肝炎普查、宫颈癌筛查、糖尿病抽样调查等。
横断面研究的优点是研究周期短,能在较短的时间获得对研究总体全面的概括性的认识。
缺点是只能获得患病率,而不能获得发病率。
由于是在同一时点调查因和果,因此无法对因果关系作判断。
横断面研究设计(示意图)
调查设计的内容(以糖尿病抽样调查为例)
(1)确定研究目的
了解糖尿病在一般成年人(30岁以上)(全国、广东省或城市)中的流行情况和危害程度。
探讨与糖尿病患病有关的危险因素(如遗传、肥胖、饮食习惯、吸烟与饮酒等)。
(2)确定研究对象和样本量
研究的总体(全国、广东省或广东的城市居民)、居民的定义、年龄范围、性别比例
抽样的方法与抽样比例(样本量估计)
(3)确定观察指标
糖尿病的诊断标准
调查方法和检测方法
调查的界定时间
(4)制定调查表
根据样本量和研究目的确定调查表的内容
样本量少时,每人的调查时间可以稍长,调查表内容可以多一些。
如样本量大,每个人的调查时间有限,调查表应集中于关键的内容。
分析项目:
如年龄、性别、家族史、体重、身高、饮食习惯、烟酒嗜好史等。
核对项目:
姓名、身份证号、联系电话、地址等。
调查员的姓名和调查日期
调查前需对调查人员做培训,统一询问和填表方式。
并可以做试访。
(5)设计统计分析指标
患病率,标准化率,χ2检验等
随机抽样的方法与标准误计算
1.单纯随机抽样(simplyrandomsampling)
随机化方法:
抽签、随机数字表或随机数发生器。
单纯随机抽样是最基本的随机抽样方法,也是其它抽样方法的基础。
优点是简单易行,适合样本量较少,方便编号的对象。
标准误的计算也较简单。
但样本大时不可能实施。
标准误计算:
无限总体抽样,计算同前;有限总体抽样,乘上一个比例系数
设总体数为N,样本数为n,则:
2.系统抽样(机械抽样)(systematicsampling)
随机化方法:
按一定顺序,等距抽取样本。
距离按抽样比例定,开始点用随机数定。
系统抽样方法简单易行,容易得到一个按比例分配的样本。
适合抽样对象已经有某种编号顺序,一般情况抽样误差比单纯随机抽样小。
缺点是如果抽样顺序与某因素的分布规律吻合时,可能抽得有偏样本。
无专门的标准误计算公式。
标准误计算:
无专用的公式,一般用单纯随机抽样公式。
3.分层抽样(stratifiedsampling)
随机化方法:
随机化不能完全避免抽取的样本在一些重要的因素出现偏倚。
为保证抽取的样本在这些重要的因素达到均衡,可采取分层抽样的方法。
如糖尿病调查中为保证样本的年龄分布和性别分布与总体相符,可以将抽样总体按年龄性别分层。
如:
各性别年龄层的总体人数
年龄组
男
女
30-
40-
50-
60-
分层抽样的优点是抽样误差较少,可以对不同层采用不同随机化方法,还可对各层作独立的分析。
缺点是工作量大,并且需先对抽样总体有一定了解。
按比例分层随机抽样:
对每层中的抽样总体按固定比例随机抽取样本。
最优分配分层随机抽样:
按估计的各层的样本数随机抽取各层的样本。
标准误计算:
设总体数为N,各层的总体数为Ni,各层的方差为Si2,各层抽取的样本数为ni,则:
4.整群抽样(clustersampling)
单纯随机抽样、系统抽样和分层随机抽样都要求对每名对象编号,然后随机抽样。
当抽样总体非常大时,光编号的工作量就不堪设想,这时可采用整群抽样。
随机化方法:
整群抽样是将抽样总体分成若干群,如县、市、学校、班等,然后对群作随机抽样。
整群抽样的优点是方便组织,节省经费,容易控制调查质量。
缺点是抽样误差较大。
标准误计算:
设抽取的整群数为k,各整群内的个体数相等时,则:
如各整群的个体数不等时,以上公式中需给每群的计算乘上一个权数mi2/m2。
在实践中,常常是几种抽样方法结合起来使用。
如广东省的糖尿病抽样调查,将广东省的县市按经济发展水平分成山区、丘陵和沿海平原三层,每层又分农村和城市,再以县市为单位实行整群抽样。
抽取的县市再以乡或街道为单位作整群抽样,被抽取的乡和街道进行全部居民的调查。
横断面研究抽样调查的样本含量估计
在抽样调查时,如目的是估计总体均数或总体率,则需计算抽样的样本量,以保证抽样得到的样本均数或样本率不会与总体参数间有太大的误差。
(一)样本含量估计需要先确定以下参数:
1.容许误差δ:
常取置信区间(由文献或预调查取得)的一半。
2.总体标准差σ或总体率π:
由文献或预调查取得。
3.第一类误差的概率α:
(二)样本含量的计算:
1.整群抽样样本含量的计算:
0
(1)无限总体估计总体率时样本含量的计算:
为预查的群体数,
和
为预查的群体中第
群调查人数和某事件的发生频率;
和
为
群的平均调查人数和平均发生频率。
有限总体:
k1=k0(1-k0/K)K为所有群体数。
(2)无限总体估计总体均数时样本含量的计算:
有限总体:
k1=k0(1-k0/K)
例15.1:
K=55,ky=2,p1=0.2536,m1=4180,p2=0.1449,m2=4970,α=0.05,Z0.05=1.96,δ=0.1。
m=(4180+4970)/2=4575
p=(1060+720)/(4180+4970)=0.1945
k0=2.19≈3k1=3(1-3/55)=2.84≈3
2.单纯随机抽样样本含量的计算:
(1)无限总体所需样本量:
(2)有限总体所需样本量:
n1=n0(1-n0/N)
例15.2:
P=0.08,P0=0.1,α=0.05
3.分层抽样样本含量的计算:
(1)估计总体率所需样本含量:
Ni,pi,qi为第i层的例数、阳性率及阴性率,N为总例数,Wi=Ni/N(人口构成比),V为估计总体概率的方差。
(2)估计总体均数所需样本含量:
Si为第i层的标准差,
。
例15.4:
Z0.05=1.96,δ=0.2,V=(0.2/1.96)2=0.0104
n=(2.6409/(0.0104+2.6869/13519)=249.26≈250
i
Ni
Wi
Si
NiSi
wi
Wi2Si2/wi
WiSi2
ni
2-
3773
0.2791
11.51
1.48
5584.04
0.2542
0.6712
0.6113
64
3-
5324
0.3938
13.93
1.89
10062.36
0.4580
1.2095
1.4067
115
4-
4422
0.3271
15.60
1.43
6323.46
0.2878
0.7602
0.6689
72
合计
13519
1.0000
21969.86
2.6409
2.6869
251
现时寿命表(Currentlifetable)
(一)基本概念:
寿命表是根据特定人群的年龄别死亡率编制出来的一种统计表,它说明在该特定人群年龄别死亡率的条件下,一代人的生命过程或死亡过程。
根据研究设计的方式不同,寿命表分为两类:
1.现时寿命表(currentlifetable):
是根据对特定人群的横断面调查资料提供的年龄别死亡率编制出来的一种统计表。
原理:
假定有同时出生的一代人,按照特定的一组年龄别死亡率先后死去,直到死完为止,可以用现时寿命表方法计算出这一代人在不同年龄组的死亡概率、死亡人数、活满某年龄的尚存人数及预期寿命等指标,反映在遵循特定人群年龄组死亡率条件下,假想的一代人的生命过程。
2.定群寿命表(cohortlifetable)是使用某一固定人群中从第一人出生开始到最后一人死亡为止的前瞻性观察所得实际死亡资料计算的,主要用于前瞻性研究资料或临床随访资料的分析。
根据是每岁计算还是按年龄组计算,现时寿命表又分成两类:
1.完全寿命表(completelifetable)是一岁一组计算死亡率和期望寿命。
2.简略寿命表(abridgedlifetable)是零到不足1岁一组,1-4岁一组,以后都为5岁一组,只编到85岁为止。
寿命表的优点:
与其它死亡统计指标相比,寿命表有着不受年龄构成影响,可直接作不同人群间比较,信息量大,能反映一段时间来的健康水平等优点,并可计算死亡统计最重要的综合性指标。
(二)现时简略寿命表的编制方法和计算公式:
基本资料:
性别年龄别人口数和性别年龄别死亡数
由上两个数据得到年龄别死亡率。
计算指标:
1.年龄别死亡率:
mx=Dx/Px(0~组mx不稳定,空置)
2.年龄别死亡概率:
qx=2nmx/(2+nmx)
q0用m0代替,q80为1。
3.寿命表死亡人数:
dx=lxqx
4.寿命表尚存人数:
l0=100000,lx+n=lx-dx
5.生存人年数:
Lx=n(lx+lx+n)/2,L0=l1+a0d0,L80+=l80/m80+
6.总人年数Tx=ΣLx
7.期望寿命:
ex=Tx/lx
年龄
x
人口数
P
死亡数
D
死亡率
m
死亡概率
q
尚存人数
l
死亡人数
d
生存人年数
L
生存总人年数
T
期望寿命
e
0-
52087
2531
-
0.048592
100000
4859
96259
6772387
67.72
1-
207327
841
0.004056
0.016095
95141
1531
377502
6676128
70.17
5-
428534
523
0.001220
0.006084
93610
570
466628
6298626
67.29
10-
502742
391
0.000778
0.003882
93040
361
464325
5832001
62.68
…
…
…
…
…
…
…
…
…
…
75-
33289
2418
0.072637
0.307369
46623
14330
197290
428985
9.20
80+
20893
2912
0.139377
1.00000
32293
32293
231695
231695
7.17
(三)寿命表指标的分析:
1.寿命表死亡概率
:
将寿命表死亡概率绘制在半对数图纸上,得“
”字型的半对数线图,不同时期的死亡概率曲线可以进行比较。
首先比较曲线的起始点的高低,起始点的高低反映婴儿死亡率的高低;其次,观察曲线低谷的宽度和最低点,通常,10~岁组的死亡概率为最低点,以后又逐渐上升,至50岁时死亡概率可成倍上升;最后,分析曲线的尾部,观察尾部的坡度,曲线尾部陡峭,说明死亡概率上升速度较快。
2.寿命表尚存人数
:
寿命表尚存人数反映遵循现时年龄别死亡率的一代假想人口的生存过程。
一般用线图绘制尚存人数曲线,比较曲线的高度和曲率。
年龄别死亡率低,曲线的曲率小,反之,曲线下降坡度大。
3.寿命表死亡人数
:
寿命表死亡人数反映一定年龄别死亡率的一代假想人口的死亡过程。
可据此绘制直方图,通过观察各年龄组直条的高低了解寿命表死亡人数的多少。
4.期望寿命
:
期望寿命是年龄
岁以后的年龄别死亡率的综合反映。
(0岁组的期望寿命):
表示同时出生的一代假想人口一生的平均寿命。
其高低受0岁以后各年龄组死亡率高低的影响,
也称为平均寿命或期望寿命。
各年龄组的期望寿命可绘制线图,分析时注意期望寿命曲线的高度和曲线的头部。
如果各年龄组死亡率降低,期望寿命的曲线起点上升,曲线位置上升。
期望寿命不受实际人口年龄构成的影响,同时又能综合反映人口的死亡水平,所以不同地区、不同时期的期望寿命可以直接比较。
所对应的
也称
岁者的剩余期望寿命,对
岁的人作人寿保险或考虑社会福利时均有参考价值。
寿命表死亡概率曲线
寿命表尚存人数曲线
预期寿命