浙大卫生综合考研真题353解析卫生统计学部分Word下载.docx
《浙大卫生综合考研真题353解析卫生统计学部分Word下载.docx》由会员分享,可在线阅读,更多相关《浙大卫生综合考研真题353解析卫生统计学部分Word下载.docx(9页珍藏版)》请在冰点文库上搜索。
常用于对慢性疾病如恶性肿瘤及心血管疾病等的治疗效果评价或预后估计。
9.总和生育率:
(表示每一个妇女一生平均生多少个孩子。
是15-49岁年龄别生育率的总和。
)假定同时出生的一代妇女,按照某年的年龄别生育水平度过其一生的生育历程,各年龄别生育率之和乘以年龄组组距,就是这一代妇女平均每人可能生育的子女数。
10.总生育率:
指某年某地平举每千名育龄妇女的活产数,国际上以15-49作为育龄妇女的年龄界限。
11.负担系数:
又称抚养比,是人口中非劳动年龄人数占劳动年龄人数之比,一般以15-64为劳动年龄,≦14≧65为非劳动年龄。
12.发病率和患病率:
发病率IR表示一定时期内,在可能发生某病的一定人群中新发生该病的强度。
患病率PR指某时点上受检人数中现患某种疾病的频率。
在一定人群是时间内有PR=IR*D。
发病率表示发病危险性的直接指标,分子只包括新发病例,分母是总人年数,是个动态指标;
而患病率常用于描述病程较长或发病时间不明确的疾病患病情况,分子包括新旧病例,分母是受检总人数,是个静态指标。
13.生存率和生存曲线:
生存率是指观察对象经历tk个时段后仍存活的可能性。
以生存时间为横轴,生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线称为生存曲线。
14.期望寿命:
ex是指同时出生的一代人活到X岁时,尚能生存的平均年数。
15.总体和样本:
根据研究目的所确定的同质观察单位的全体。
可分为有限总体和无限总体。
从总体中随机抽取部分观察单位,其观测结果的集合称谓样本,应具有代表性。
16.总体:
17.检验效能和检验水准:
1—b是指当两总体确实有差异时,按规定的检验水准a能发现该差异的能力。
检验水准是假设检验中预先规定的允许犯一类错误的概率最大值。
通常取0.05或0.01
18.第一类错误和第二类错误:
指拒绝了实际上成立的H0,这类弃“真”的错误称为一类错误或假阳性,理论上其概率大小用事先给定的a来控制。
接受了实际上不成立的H0,这类存伪错误称为二类错误,理论上用其概率大小用b控制。
N一定时,a大b小,b大a小。
B大小往往无法获知,但通过调节a大小控制。
19.区间估计:
是用已知样本统计量和标准误确定一个有概率意义的并具有较大置信度包含总体参数的区间的参数估计方法。
20.统计推断:
由样本信息对相应总体的特征进行推断的过程。
21.综合评价:
是利用表现事物不同方面特征的多个有关指标,构建综合评价模型,求出综合评价值,对评价事物进行评定,排出优劣顺序并得出相应结论的一种统计分析方法。
22.决定系数:
复相关系数的平方,表示回归平方和占总离均差平方和的比例,可定量评价在Y的总变异中,有X变量组建立的线性回归方程所能解释的比例。
23.回归系数:
即直线的斜率,在直线方程中用b表示,X每增减一个单位时,Y平均改变b个单位。
B是基于样本信息获得,亦是样本的回归系数,是对总体回归系数的点估计。
24.标准差和标准误:
标准差是方差的平方根,标准差的量纲和原始数据的一致,它适用于近正态分布的资料。
标准误是样本均数的标准差,反应样本均数之间的离散程度及抽样误差的大小,当样本含量一定时标准误随着标准差的大小而变化。
25.二项分布:
是一种离散型随机变量的分布类型。
如果随机变量X的可能取值0,1,2,3…..N且X=K的概率为P(X=K)=则称随机变量X服从以N,为参数的二项分布,记为X-B(N,)
26.参数和统计量:
是反映总体特征的统计指标,如总体均数,总体率等,总体参数是固定的常数。
统计量是指与总体参数对应,通过样本的统计指标,如样本均数,样本率等。
可用来估计总体参数,统计量是在总体参数附近波动的随机变量。
27.非参数统计法:
是指不依赖总体的分布类型,也不对总体参数进行统计推断的一类假设检验方法,不受总体参数的限制。
28.标准差:
是方差的平方根,标准差的量纲和原始数据的一致,它适用于近正态分布的资料。
简答篇
1.假设检验时,P≤a时,则拒绝H0,理论依据是什么?
P值系在H0所规定总体做随机抽样,获得等于及大于依据现有样本信息所计算得的检验统计量的概率。
P≦0.05时说明在H0成立的条件下,得到现有试验结果的概率小于a,因为小概率事件在一次随机试验中不太可能发生,所以有理由怀疑H0的正确性,同时还知道拒绝H0可能犯一类错误的概率不会大于a
2.简述二项分布、Poisson分布和正态分布的区别和联系
二项分布和poisson分布是离散型随机变量的常见分部,正态分布是连续型随机变量常见分部,三者有一定关系。
1n很大,π很小时,且nπ为一常数时,二项分布近似poisson分布…
2n很大,nπ>
5且n(1-π)>
5时,二项分布近似正态分布
3λ≧20时poisson分布近似正态分布N()
3.样本均数的抽样分布有何特点?
①:
从正态分布总体X-N(u,)中随机抽样,样本均数呈正态分布X-(u)。
从非正态分布总体中随机抽样,当样本量n足够大时,样本均数的分布近似正态分布。
②:
样本均数之间,样本均数与总体均数之间有差别
③:
样本均数间的变异程度比个体变异小
4.简述卡方检验的用途
⑴单样本频率分布的拟合优度检验。
⑵配对设计下两组频数分布的概率是否相同。
⑶完全随机设计下两组或多组频数分布的概率是否相同。
⑷推断两个变量或特征间有无关联性。
5.计算标准化率时,通常以什么作为标准
有三种方法:
①:
从比较组中任选其一作为标准构成
选取比较两组的各层例数的合计作为标准
另外选取一个包含比较各组的有代表性、较稳定、数量较大的人口作为标准。
如世界的、全国的或本单位的历年累积数据。
6.计算参考值范围的方法有哪些
有两种方法:
正态分布法和百分位数法,前者要求指标服从正态分布,后者指标不服从正态分布。
7.调查研究中系统误差的来源有哪些?
如何控制?
如何评价调查质量?
系统误差来源于设计阶段、数据搜集、整理与分析阶段。
正确划分调查范围,正确选择调查指标,明确定义调查项目,正确设置调查问题,选择恰当的调查方式,预调查;
严格进行数据清理和检查,及时发现和更正错误。
一般采用效度和信度两个指标进行评价。
8.病死率、死亡率和死亡概率的区别是什么?
病死率反映的是患者中因患病而死亡的频率;
死亡率表示年中人口的死亡频率,而死亡概率是年初人口在往后一年中的死亡机会大小,死亡率与死亡概率不同在于分母不同。
9.估计样本含量的意义何在?
样本含量估计的基本前提条件是?
意义:
在实验设计总要对样本例数进行估计,如果例数太少,有可能把个别情况认为普遍情况,把偶然性或巧合的现象当作必然规律现象,以致错误的推论到总体。
例数太多,会增加实际工作的困难,且势必造成人力、物力、时间的浪费。
因此在保证实验结果有一定可靠性的条件下,确定最少的样本例数,可节约人力、物力和经费。
前提:
第一类错误概率a越小,样本越大。
检验功效1-b越大,样本越大。
容许误差∮越小,样本越大。
总体标准差越大,样本越大。
10.简述综合评价的内容和一般步骤
综合评价:
步骤:
①明确评价目标,确定评价指标体系
②确定评价标准
③确定指标权重系数
4选择适宜的评价方法,构建综合评价模型,求出综合评价值
5根据综合评价值对评价对象进行分析和评价,并由此得出结论。
11.能否说假设检验的P值越小,比较的两个总体指标间的差异越大?
为什么?
不能,因为p值的大小只能说明差异是否有统计学意义,拒绝H0只说明差异不为零,p值越小,指说明越有理由拒绝H0犯一类错误的概率远远小于a
12.医学参考值范围的含义是什么?
确定的原则和方法是什么?
①含义:
指特定的“正常人群”的解剖、生理、生化指标及组织代谢产物含量等数据大多数个体的取值所在范围。
习惯用人群95%的个体某项医学指标的取值范围作为医学参考范围。
②原则:
足够例数的样本,并判断是否应分层确定医学参考值范围。
如测定值在性别和年龄组间差别较大,则应分层。
③方法:
13.简述方差分析的基本思想和分析步骤
1基本思想:
根据实验设计类型把全部观察值间的变异,按设计和需要分解两个或若干个组成部分,总自由度也分解成相应几个部分,再作分析。
分解的每一部分代表不同含义,其中至少有一部分代表个均数间的变异,另一部分代表误差。
2分析步骤:
(根据设计类型建立各个因素的假设检验)建立假设检验和确定检验水准,计算统计量,求p值,确定有无统计学意义。
14.常用的相对数指标有哪些?
他们在意义和计算上有何不同?
相对数分析时为什么不能以构成比代替率?
频率指标或比例:
近似反映某一事件出现的概率【01】无量纲
强度指标或率:
单位时间段内某现象发生的频率可大于1有量纲
相对比:
任何两个相关联的变量A,B之比无限制可有可无量纲
15.简述四种基本抽样方法的优缺点及适用场合
答:
(1)单纯随机抽样:
最简单、基本的抽样方法,是其他概率抽样的基础,主要用于总体不太大的情形。
优点:
简单直观,是其他抽样方法的基础;
均数(或比率)及其标准误计算简便。
缺点:
例数较多时,编号麻烦,实际工作中难以办到;
当总体变异大时,代表性不如分层抽样;
样本分散,难以组织调查。
适用范围:
是其他抽样方法的基础,主要用于总体不太大的情形。
(2)系统抽样:
是按照一定的循序,机械地间隔若干单位抽取一个单位的抽样方法,优点:
易理解,简便易行;
可得到按比例分配的样本;
样本在总体中的分布较均匀。
观察单位按顺顺序有周期趋势或递增(减)时易产生偏差。
主要用于按抽样顺序个体随机分布的情形
(3)分层抽样:
将总体按照某特征分成若干层,再从每层中进行单纯随机抽样,能保证每一层的个体都有一定量的样本量。
减少抽样误差;
可对不同层采用不同的抽样方法;
可对不同层进行独立分析。
若分层变量选择不当,层内变异较大,层间变异小,分层抽样就失去意义。
主要用于层间差异较大的情形
(4)整群抽样:
将总体分为若干群组,抽取其中的分布群组作为观察单位。
样本例数一定时,抽样误差大于单纯随机抽样(因样本未广泛散布于总体中)。
主要用于群间差异较小的情形。
16.简述卡方检验的特点
一、卡方检验的特点
卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
即根据样本的频数分布来推断总体的分布。
它属于自由分布的非参数检验。
它可以处理一个因素分为多种类别,或多种因素各有多种类别的资料。
所以,凡是可以应用比率进行检验的资料,都可以用卡方检验。
二、卡方检验的统计量
卡方检验统计量的基本形式为公式(10.1)。
χ2值有以下几个特点:
(1)χ2值具有可加性。
(2)χ2值永远是正值。
(3)χ2值的大小随实际频数与理论频数差的大小而变化
计算篇
1.按国家固定平均每毫升饮用水中细菌总数不得超过100个,现从某水源随机抽取2毫升水测的细菌总数215个,问该水源是否符合饮用水的条件
2.为研究某病在某地是否有家族聚集性,一研究人员在该地随机抽查150户3口之家,结果全家无病的112户,一个病人的家庭20户,两个病人的家庭11户,三个病人的家庭7户,请做统计推断
若该病没有家族聚集性,则家庭成员发病的概率之间相互独立,所以应该满足二项分布。
所以本题目采用二项分布的拟合优度检验
(1)建立假设检验,确定检验水准
H0:
该疾病的发生无家族聚集性
H1:
该疾病的发生有家族聚集性
a=0.10
(2)计算检验统计量
该病的发病率P=(0×
112+1×
20+2×
11+3×
7)/150=0.14
分别计算二项分布X=0、1、2、3的概率值P(X),从而计算出理论频数。
X实际户数AP理论户数T=150PT-A(T-A)2(T-A)2/T
1⑵⑶⑷⑸⑹⑺
01120.63605695.4084-16.5916275.281192.885293
1200.31063246.594826.5948707.283315.1794489
2110.0505687.5852-3.414811.660859
370.0027440.4116-6.5884105.459219
计150150125.06
(3)确定P值,作出推断:
自由度=组数4-2=2卡方值为125.06,p小于0.005,拒绝H0,接受H1,且差异有统计学意义,可认为此病有家族聚集性!
3.某地抽样调查健康成人的红细胞数(万/mm2)结果如下:
性别例数均数标准差
男36046657
女25041049
问①男女两组红细胞数的变异程度如何比较,哪一组较大
②怎样估计当地健康女性红细胞数的95%参考值范围
③估计当地全体健康成年男性红细胞平均数的可能范围(可信度95%)
④如何推论当地健康男性成人的红细胞平均水平高于健康女性
4.在某地随机抽样的十万人中恶性肿瘤患者有520人,估计该地平均每一万人中的恶性肿瘤患者数。
(95%可信区间)