卫生统计学教材刘1.doc

上传人:wj 文档编号:4701310 上传时间:2023-05-07 格式:DOC 页数:33 大小:713.79KB
下载 相关 举报
卫生统计学教材刘1.doc_第1页
第1页 / 共33页
卫生统计学教材刘1.doc_第2页
第2页 / 共33页
卫生统计学教材刘1.doc_第3页
第3页 / 共33页
卫生统计学教材刘1.doc_第4页
第4页 / 共33页
卫生统计学教材刘1.doc_第5页
第5页 / 共33页
卫生统计学教材刘1.doc_第6页
第6页 / 共33页
卫生统计学教材刘1.doc_第7页
第7页 / 共33页
卫生统计学教材刘1.doc_第8页
第8页 / 共33页
卫生统计学教材刘1.doc_第9页
第9页 / 共33页
卫生统计学教材刘1.doc_第10页
第10页 / 共33页
卫生统计学教材刘1.doc_第11页
第11页 / 共33页
卫生统计学教材刘1.doc_第12页
第12页 / 共33页
卫生统计学教材刘1.doc_第13页
第13页 / 共33页
卫生统计学教材刘1.doc_第14页
第14页 / 共33页
卫生统计学教材刘1.doc_第15页
第15页 / 共33页
卫生统计学教材刘1.doc_第16页
第16页 / 共33页
卫生统计学教材刘1.doc_第17页
第17页 / 共33页
卫生统计学教材刘1.doc_第18页
第18页 / 共33页
卫生统计学教材刘1.doc_第19页
第19页 / 共33页
卫生统计学教材刘1.doc_第20页
第20页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

卫生统计学教材刘1.doc

《卫生统计学教材刘1.doc》由会员分享,可在线阅读,更多相关《卫生统计学教材刘1.doc(33页珍藏版)》请在冰点文库上搜索。

卫生统计学教材刘1.doc

第七章分类资料的统计描述

第一节分类资料的频数表

在前面的章节我们已经学习了计量资料的描述性统计指标,今天我们来学习分类资料的描述性统计指标。

分类变量的变量值是定性的,对其观察结果的统计整理,应先按照分析要求,分类汇总观察单位数,即频数,用统计表列出,即为分类资料的频数表。

如表7.1第

(1)、(3)两栏某市某年按市区统计的急性传染病发病数。

表7.1某市某年各市区急性传染病发生情况

市区

(1)

年平均人口数

(2)

急性传染病数

(3)

与一区发病数比

(4)

构成比

(5)

各区发病率

(6)(1/10万)

636723

2433

-

18.9

382

389540

3033

1.25

23.5

779

699712

1650

0.68

12.8

236

328363

1503

0.62

11.6

458

286967

1282

0.53

10.0

447

317504

1853

0.76

14.4

584

153838

1130

0.46

8.8

735

合计

2812647

12884

-

100.0

458

对于以上资料,常用相对数来描述,在学习相对数之前,先了解一下总量指标的概念。

一、总量指标

定义:

统计分组汇总后小计或总计的绝对数。

意义:

反映事物在一定条件下的实际规模和水平,是计划和总结工作的总结。

缺点:

不利于保密。

不具有可比性。

第二节常用相对数及其意义

相对数(RelativeNummber),是两个相关总量指标间的比值。

其意义在于可以将基数不同的指标转换为基数相同的指标,使其具有可比性。

常用的相对数有率、构成比、相对比。

一、强度相对数

简称率(rate),又称为频率指标,表示在一定条件下某种现象实际发生的观察单位数与可能发生该现象的总观察单位数之比。

用来说明该现象发生的频率大小或强度。

常以百、千、万、10万等为比例基数,分别称为百分率(%)、千分率(‰)、万分率(1/万)、10万分率(1/10万)等。

计算公式为:

(或1000‰)

用符号表示为:

(或1000‰)

表7.2某地某年四种常见心血管病死亡率

病名

某地某年平均人口数

死亡人数

死亡率(1/10万)

高血压

172665

40

23.2

冠心病

172665

11

6.4

脑卒中

172665

253

146.5

风心病

172665

38

22.0

表7.2所列4种心血管病的死亡率即为频率指标,反映了不同疾病的死亡频率,也可以比较不同疾病对人群健康的影响大小。

医学上常用的率有:

患病率、感染率、死亡率、病死率、治愈率、发病率、婴儿死亡率等

二、结构相对数

又称为构成比(proportion)、百分比(Percentage)表示某一事物内部各组成部分所占的比重或分布。

常以百分数表示。

用来描述疾病或死亡的顺位、位次或所占比重。

计算公式为:

用符号表示为:

表7.3某省1992年护理人员学历结构

学历

(1)

人数

(2)

构成比(%)(3)

大学本科

99

0.14

大学专科

1284

1.74

中等专科

53521

72.65

无规定学历

18763

25.47

合计

73667

100.00

如表7.3,某省1992年共有护理人员73667人。

其中,学历为大学本科的有99人,仅占0.13%;中等专科53521人,占72.65%,比例最高。

由本例我们可以看出构成比的两个特点如下:

1.各组成部分的构成比之和为100%。

2.某一部分所占比重增大,其它部分会相应地减少。

如果大学本科学历人数增加,其它学历人数不变,那么在大学本科构成比增加的同时,其它学历的构成比将会有不同程度的降低。

三、比较相对数

又称作比值(ratio),是两个相关指标之比。

用以说明A是B的若干倍或百分之几。

通常用倍数或分数表示。

计算公式为:

相比较的两个指标可以性质相同,如一个地区的人口性别比;也可以性质不同,如人口数与耕地面积之比。

医学人口学中最常见的相对比有性别比、儿童妇女比等。

如某年某地出生婴儿中,男性婴儿有185人,女性婴儿有176人,则出生婴儿性别比为:

185/176=1.05(倍)或者176/185×100%=95.14%

但实际工作中出生性别比常用男性出生数/女性出生数。

计算相对比时,A、B两指标既可以是绝对数,也可以是相对数。

例如研究吸烟与肺癌的关系时,在一组吸烟人群中统计得到肺癌死亡率为54.0/10万;在非吸烟组中(对照组)肺癌死亡率为9.0/10万。

则吸烟者与不吸烟者相比,肺癌死亡率的相对危险度为:

54.0/9.0=6.0(倍)

第三节应用相对数的注意事项

一、率与构成比的区别

构成比和率是两种性质不同的指标,构成比只能说明事物内部各组成部分的比重,不能说明某现象发生的频率或者强度。

但在实际工作中,以构成比代替率的错误现象时有发生。

例如某地某年门诊诊断流感患者共274267人,其中城市居民有154241人,占56.24%,农村农民有120026人,占43.76%,这时容易错误地得出城市人流感发病率高的结论。

实际上这组数据只反映出医院门诊诊断流感患者中城市居民多于农民,不能反映流感发病率。

农村可能由于当地农民对流感不够重视,到医院就诊比例小。

要计算流感发病率,必须用发生流感的病例数除以当地当时总人口数。

二、计算相对数时分母不宜过小

计算相对数时分母过小会使得相对数不稳定,波动较大。

观察单位足够多时,计算相对数比较稳定,能够正确反映实际情况。

如用某种新药治疗5例病人,全部治愈,计算治愈率为100%,若4例治愈,则治愈率为80%,两者之间波动太大,实际上只有1例之差,这时候最好用绝对数表示。

如果必须用率表示,可同时列出可信区间(率的可信区间计算在后边章节介绍)。

三、平均率(总率)的计算

对于观察单位不等的几个率,不能直接相加求其平均率,而应该用合计的数据来计算。

例如表7.4

表7.4某市各区流感发病率

地区

平均人口

新发病例数

发病率(%)

甲区

100000

20000

20.0

乙区

80000

12000

15.0

丙区

40000

6500

16.3

合计

220000

38500

17.5

表中求平均率时将三个区各自的发病率相加或相加后除以3求平均都是错误的,正确的平均发病率(又可以称为总发病率)=38500/220000×100%=17.5%。

四、资料的可比性

决定率或者构成比等相对数大小的因素是多方面的。

所以进行两个或者多个率或者构成比比较时,除了所研究的因素外,还有其它重要的影响因素应相同或者相近,要在相同的条件下比较应注意以下两方面内容:

1.研究方法相同,观察对象同质,观察时间相等,地区、民族等客观条件一致。

例如,

比较不同抗生素治疗肺炎患者疗效,要求给药方式一样,剂量一致,用药时间相同,而且患者的客观条件要尽可能一致,如,均为12岁男孩,生活在同一个城市,病情一样且无其它并发症状。

2.其它影响因素在各组的内部构成是否相同。

如果两组资料的年龄、性别等构成不同时,只能分年龄、性别比较各小组的率或者对各组进行标准化后再比较(见下节),例如表7.4

表7.5甲乙两县各年龄组人口数及食管癌死亡率(1/10万)

年龄组

(岁)

(1)

甲县

乙县

人口数

(2)

人口构成

(3)

食管癌

死亡数

(4)

食管癌死亡率(5)

人口数

(6)

人口构成

(7)

食管癌死亡数

(8)

食管癌死亡率

(9)

0~

30~

40~

50~

60~

70~

1756897

244942

251678

206947

143893

90270

0.6520

0.0909

0.0934

0.0768

0.0534

0.0335

0

12

91

307

460

292

0

4.9

36

148.3

319.7

323.5

1725819

289298

250480

191204

114355

51670

0.6580

0.1103

0.0955

0.0729

0.0436

0.0197

0

25

125

344

371

170

0

8.6

49.9

179.9

324.4

329.0

合计

2634627

1.0000

1162

43.12

2622826

1.0000

1035

39.46

表7.5中存在矛盾,乙县各年龄组死亡率都比甲县高,但总死亡率却比甲县低,这是为什么呢?

错误结论的原因在于年龄是影响疾病死亡率的比较重要的混杂因素,而混杂因素的构成在两地都明显不同,如果直接比较总率会造成结论错误!

正确做法是:

(1)设计阶段时事先对这些可能的混杂因素进行控制。

(2)按可能的混杂因素进行分层分析。

(3)应用标准化率法进行比较。

五、样本率(或构成比)比较应遵循随机抽样,要做假设检验。

第四节标准化法及其应用

一、标准化法的意义和基本思想

当两组资料进行比较时,如果其内部不同小组率有明显差别而各小组内部构成(如年龄)也明显不同,直接比较两个总率是不合理的。

如比较两地的总死亡率,因为年龄因素对死亡率有明显影响,所以如果两地人口年龄构成不同就会影响总死亡率的高低。

此时,年龄成为混杂因素,只有消除其影响,才能正确反映地区因素对死亡率的影响。

在统计学里,常采用标准化的方法消除资料内部构成不一致对于总率的影响。

例如表7.6对于两种疗法疗效进行比较。

表7.6两种疗法疗效比较

治疗

分组

旧疗法

新疗法

治疗人数

治愈人数

治愈率(%)

治疗人数

治愈人数

治愈率(%)

成人组

100

50

50.0

200

100

50.0

儿童组

200

20

10.0

100

10

10.0

合计

300

70

23.3

300

110

36.7

从表中合计治愈率来看,新疗法的治愈率(36.7%)比旧疗法(23.3%)高,但我们分别观察成人组和儿童组就发现,新旧疗法的治愈率是一样的,即成人组50.0%,儿童组10.0%。

新旧疗法总治愈率之所以相差很大,是由于两种疗法选择的样本人群年龄构成不同。

新疗法组成人所占比例高,而且成人的治愈率高,造成总率较旧疗法组高。

因此要正确比较两种疗法疗效,必须先将两治疗组的年龄构成按照统一的标准进行校正,然后计算出校正后的标准化总率再进行比较。

这种统一构成,然后计算标准化率的方法,称为标准化法。

由此可见,标准化法的基本思想,就是采用统一的标准构成以消除构成不同对于总率的影响,使通过标准化后的标准化总率具有可比性。

二、标准化率的计算

标准化率,也称为调整率,常用的计算方法有直接法和间接法,现以死亡率的年龄构成标准化为例来说明。

表7.7是计算标准化率的数据符号模式。

表7.7计算标准化率的数据符号

年龄组

标准组

被标化组

人口数

死亡数

死亡率

人口数

死亡数

死亡率

1

2

3

.

.

.

i

.

.

.

k

N1

N2

N3

.

.

.

Ni

.

.

.

Nk

R1

R2

R3

.

.

.

Ri

.

.

.

Rk

P1

P2

P3

.

.

.

Pi

.

.

Pk

n1

n2

n3

.

.

.

ni

.

.

nk

r1

r2

r3

.

.

.

ri.

.

.

.

rk

p1

p2

p3

.

.

.

pi

.

.

pk

合计

N

R

P

n

r

p

直接标准化率:

已知标准组年龄别人口数时,(7.1)

已知标准组年龄别人口构成时,(7.2)

间接标准化率:

(7.3)

直接法的意义可用公式(7.1)及(7.2)来说明,式(7.2)中,Ni/N为标准组人口年龄构成,它和式(7.1)中的Ni均可以看成是Pi的权数,所以求标准化率P′实际是求Pi的加权均数,也就是对被标准化组采用了统一的权数。

式(7.1)中的ΣNiPi是被标准化组按标准组年龄组人口数算得的预期死亡数,除以标准组的总人口数即直接法的标准化率。

间接法的意义可用公式(7.3)来说明,式中的ΣniPi是被标准化组按标准组年龄组死亡率算得的预期死亡数,r/ΣniPi是被标准化组实际死亡数与预期死亡数之比,称为标准化死亡比(standardmortalityrate),用SMR表示,若SMR>1,表示被标化人群的死亡率高于标准组,;反之,若SMR<1,表示被标化人群的死亡率低于标准组。

但是样本SMR有抽样误差,还需要做总体SMR是否为1的假设检验。

于是间接法标准化率P′=P×SMR,它用于被标化人群与标准组的比较。

由此可得,计算标准化率的步骤如下:

(1)根据现有数据条件选择直接法或者间接法。

公式中的右端为必须的已知数据条件,如已知P′则用直接法。

理论上式(7.1)和式(7.2)所算得的结果应该相同,但由于运算中的四舍五入的影响,可能稍有出入;实际工作中,有时只有某病的死亡总数r和各年龄组人口数ni,缺少各年龄组死亡率Pi(或者有些年龄组的人口数过少,Pi不可靠)则宜用间接法。

(2)选定标准。

标准组应选用有代表性的、较稳定的、数量较大的人群,如世界的、全国的、全省的。

本地区的或本单位历年累计的数据。

也可选择相互比较人群之一或合并作标准。

国际间比较时需采用世界通用的标准,如世界卫生组织常采用下列人口年龄构成比计算各国的标准化肿瘤死亡率。

年龄组(岁)0~1~5~10~15~20~25~30~35~40~

%2.49.610.09.08.08.08.06.06.06.0

年龄组(岁)45~50~55~60~65~70~75~80~85~

%6.05.04.04.03.02.01.00.50.5

(3)按照公式计算标准化死亡率。

例7.1对于表7.5中的数据资料,求甲乙两县的食管癌标准化死亡率。

1.本例已知两县的年龄组死亡率Pi,宜采用直接法。

2.选定某地各年龄组人口数Ni作为标准。

3.按照公式(7.1)计算甲乙两县食管癌标准化死亡率,见表7.8。

表7.8用直接法计算甲乙两县食管癌的标准化死亡率(1/10万)

年龄组(岁)

(1)

标准人口数

(2)

甲县

乙县

原食管

癌死亡率pi

(3)

预期食管癌死亡人数Nipi

(4)=

(2)(3)

原食管癌死亡率pi

(5)

预期食管癌死亡人(Nipi)

(6)=

(2)(5)

0~

30~

40~

50~

60~

70~

3860241

553681

566717

482455

344998

207377

0.00

4.90

36.00

148.30

319.70

323.50

0

27

205

715

1103

671

0.00

8.60

49.90

179.90

324.40

329.00

0

48

283

868

1119

682

合计

6015469

(N)

43.12

2721

()

39.46

3000

()

则:

甲县食管癌标化死亡率

p’==45.23/10万

乙县食管癌标化死亡率

p’==49.87/10万

可见甲县食管癌死亡率低于乙县。

这样就与分年龄组比较食管癌死亡率结论一致了,解决了未标化前的矛盾。

注意:

1.选用标准不同,所得标准化率也可能不同。

因此当比较几个标准化率时,应该采用统一的标准人口。

标准化率只能反映相互比较资料间的相对水平。

2.各年龄组间若出现明显交叉时,应比较年龄组死亡率,而不宜用标化法比较。

3.SMR一般不能直接相互比较

4.两样本标化率比较应作假设检验。

例7.2已知甲县食管癌死亡总数为452人,乙县为353人,以及两县人口资料见表7.9第(3)、(5)栏,求甲乙两县的食管癌标准化死亡比及标准化死亡率。

表7.9用间接法计算甲乙两县食管癌的标准化死亡率(1/10万)

年龄组(岁)

(1)

标准食管癌死亡率Pi

(2)

甲县

乙县

人口数ni

(3)

预期食管癌死亡人数nipi

(4)=

(2)(3)

人口数ni

(5)

预期食管癌死亡人(nipi)

(6)=

(2)(5)

0~

30~

40~

50~

60~

70~

0.5

14.6

88.1

332.1

591.0

663.3

378977

63436

54910

41970

25060

10780

2

9

48

139

148

72

282762

39443

40488

33309

23167

14548

1

6

36

111

137

96

合计

79.8

575133

418

()

433717

387

()

1.本例已知甲乙两县食管癌死亡总数r及年龄组人口数ni,宜采用间接法。

2.选定某地某年的食管癌年龄组死亡率pi作标准,如表中第

(2)栏。

3.按公式(7.3)计算两县的标准化死亡率。

甲县的食管癌标化死亡比SMR=452/418=1.08

甲县的食管癌标化死亡率p’=(79.8/10万)×1.08=86.2/10万

乙县的食管癌标化死亡比SMR=353/387=0.91

乙县的食管癌标化死亡率p’=(79.8/10万)×0.91=72.6/10万

请注意:

这里甲乙两县均以各自的人口构成,求得其标准化死亡率,因此不能相互比较,要比较需选用统一的人口构成。

第五节动态序列及其分析指标

动态相对数(dynamicseries),是一系列按时间顺序排列起来的统计指标(包括绝对数、相对数和平均数),用以说明事物在时间上的变化和发展趋势。

常用的分析指标见表7.10。

表7.10某地1971~1979年床位的发展动态

年份

(1)

年末床位数

(2)

绝对增长量

发展速度

增长速度

累计(3)

逐年(4)

定基(5)

环比(6)

定基(7)

环比(8)

1971

1400

100.0

100.0

1972

2100

700

700

150.0

150.0

50.0

50.0

1973

2200

800

100

157.1

104.8

57.1

4.8

1974

2300

900

100

164.3

104.5

64.3

4.5

1975

2500

1100

200

178.6

108.7

78.8

8.7

1976

2600

1200

100

185.7

104.0

85.7

4.0

1977

3000

1600

400

214.3

115.4

114.3

15.4

1978

3700

2300

700

264.3

123.3

164.3

23.3

1979

4500

3100

800

321.4

121.6

221.4

21.6

1.绝对增长量说明事物在一定时期所增加的绝对数量。

可以计算:

①累计增长量,如表中第(3)栏,以1971年床位数为基数,各年床位数与其相减即得。

②逐年增长量,即下一年床位数与上一年相减,如表中第(4)栏。

2.发展速度和增长速度可计算①定基比。

即统一用某个时间的指标为基数,以各时间的指标与之相比;②环比。

即以前一个时间的指标为基数,以相邻的后一个指标与之相比。

发展速度和增长速度均为比,说明事物在一定时期的速度变化。

增长速度=发展速度-1(或100)。

3.平均发展速度和平均增长速度用于概括某一时期的速度变化,其计算公式为:

平均发展速度=

平均增长增长速度=平均发展速度-1

本例计算:

平均发展速度==1.157=115.7%

平均增长速度=1.157-1=0.157=15.7%

4.动态数列不仅可以总结过去,还可以预测未来。

如:

根据表7.10,预测该地1982年的床位数。

解:

1.157=得a11=6963张

即根据该地1971-1979年的平均发展速度,到1982

年该地床位数可达6963张。

需要注意:

预测时要用近期比较稳定的速度会更接近实际的预测值。

第八章计数资料的统计推断

前面我们介绍了计量资料的统计推断。

在医学研究中,计数资料的应用也是极为广泛的。

如计算治愈率、有效率、免疫率等,卫生医师常使用这些指标对某种防治措施做出效果判断。

因此,如何正确地对相对数(包括率和构成比)进行统计推断,即进行参数估计和假设检验是极为重要的问题。

本章将介绍总体率(或者构成比)的估计及率(或构成比)的假设检验方法。

第一节率(或构成比)的抽徉误差与标准误

一、率(或构成比)的抽样误差

前面我们学习了均数的抽样误差。

同样,由于随机抽样和个体变异的存在,来自同一个总体的不同样本率也不一定相等,且不一定与总体率相等。

这种由于随机抽样造成的样本率与总体率之间的差异,就叫做率的抽样误差。

它的大小可以用率的标准误来衡量。

(8.1)

二、率(或构成比)的标准误计算公式

(8.2)

实际工作中,由于我们研究的是样本,总体率未知,所以常用p代替π,得到率的标准误的估计值:

式中Sp为样本率的标准误。

P为样本的阳性率,q为样本的阴性率。

q=1-P。

n为样本含量。

三、率(或构成比)的标准误的意义及与样本量的关系

同均数的标准误类似,率或者构成比的标准误也表示抽样误差的大小。

标准误越小,说明抽样误差越小,用样本率估计总体率的可靠性越大。

率的标准误的大小也和样本含量有关系,样本量越大,标准误越小;样本量越小,标准误越大,所以可以通过增加样本量来减少抽样误差。

四、例题

例1某市为了了解已婚妇女子宫颈癌的患病情况进行抽样调查,随机抽取了2000人,患者80例。

试求此患病率的标准误。

n=2000

第二节总体率(或构成比)的估计

一、点值估计

总体率(或构成比)的点值估计和总体均数的点值估计一样,将样本率直接作为总体率的估计值。

例如,例1中的样本率是4%,我们就把它作为总体率的估计值。

二、区间估计

(8.3)

1.公式:

通式:

总体率的95%可信区间是:

总体率的99%可信区间是:

2.适用条件:

要求样本量n不能太小,样本率p不能太接近0%或者100%。

即要求:

np>5且n(1-p)>5。

3.例题

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 幼儿教育 > 幼儿读物

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2