第一章 医学统计学 讲稿文档格式.docx

上传人:b****2 文档编号:785391 上传时间:2023-04-29 格式:DOCX 页数:19 大小:121.02KB
下载 相关 举报
第一章 医学统计学 讲稿文档格式.docx_第1页
第1页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第2页
第2页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第3页
第3页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第4页
第4页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第5页
第5页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第6页
第6页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第7页
第7页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第8页
第8页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第9页
第9页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第10页
第10页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第11页
第11页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第12页
第12页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第13页
第13页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第14页
第14页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第15页
第15页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第16页
第16页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第17页
第17页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第18页
第18页 / 共19页
第一章 医学统计学 讲稿文档格式.docx_第19页
第19页 / 共19页
亲,该文档总共19页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

第一章 医学统计学 讲稿文档格式.docx

《第一章 医学统计学 讲稿文档格式.docx》由会员分享,可在线阅读,更多相关《第一章 医学统计学 讲稿文档格式.docx(19页珍藏版)》请在冰点文库上搜索。

第一章 医学统计学 讲稿文档格式.docx

生物统计学(biostatistics)

医学生为什么要学《医学统计学》

统计分析是科研工作中的重要组成部分。

《医学统计学》是医学生建立统计分析思维的入门课程,课程的学习有利于医学生对临床工作和科学研究进行科学的整理和总结,有利于对多种渠道获取的信息进行分析和批判,了解其有用性和局限性。

某院60例上感病人服用某药前后BUN值(该院参考值:

1.79---7.15)

治疗前后病人的Bun是如何变化的?

该药物对肾脏是否安全?

上述问题的回答需要利用统计描述和统计推断的有关统计方法,而类似的资料,在临床实践中是非常多见的。

作为一个优秀的临床工作者,有必要掌握一些统计方法。

某院60例上感病人服用某药前后BUN值变化

例数平均数标准差最小值最大值

疗前604.6511.132.86.9

疗后604.6461.192.27.0

前一后600.0051.18-2.52.5

(参考值:

访药对肾脏是否安全呢?

假定出现疗前正常而疗后异常的比例低于1%则认为此药安全,由上例60例病人的数据能否认为该药安全?

此问题需利用统计推断的方法,若假定

该药异常率P>

=1%(即不安全),则观察60例病人,出现0例异常的概率为

P(x=0)=0.547。

若要你做出抉择,你的结论是什么?

若观察400例病人,出现0例异常,结论又当如何?

P(x=0/p=1%)=0.0179

医学工作中常见的统计学问题

用乌贝散治疗胃溃疡100例,70人有效,是否该药有效率一定是70%?

(置信区间)

如何判断某新药是否比传统药物效果更好?

(假设检验)

子女为什么象父母,其联系强度有多大?

(相关与回归)

第二节统计学的几个基本概念

1、总体与个体

总体(population):

统计学中称试图了解和研究的全部个体为总体。

个体(individual):

可以指人、也可以指动物或学校、工厂等任何观察单位。

举例:

调查某地2004年活产婴儿的出生体重。

该地2004年所有活产婴儿的出生体重值就

构成一个总体。

不同的研究目的,有不同的总体,总体应研究目的而变。

无限总体(infinitepopulation)

有限总体(finitepopulation)

目标总体(targetpopulation):

试图了解的总体称目标总体研究总体(studypopulation):

确定资料来源的总体

注意研究总体与目标总体可能存在的差异。

2、抽样(sampling)与样本(sample)

抽样:

从总体抽取出部分个体的过程。

样本:

抽取的部分个体组成的集合。

样本容量(samplesize):

样本所含个体数。

抽样研究(samplingresearch):

为了解总

体的情况,从总体中抽取部分个体,由这部

分个体(样本)的信息来推断总体的特征。

怎样的样本才能更好地推断总体?

样本应具有代表性:

随机抽样;

样本大小适中。

简单随机抽样:

总体中每个个体都有同等的机会被抽取到样本中的抽样方法。

由此所得样本称简单随机样本。

两点说明:

1)数理统计的理认和推断方法,都是建立在随机抽样的基础之上的。

2)实际工作中,随机抽样的方法有很多,常见的有简单随机抽样、分层抽样、系统抽样等,对于不同抽样方法,统计推断方法也不完全一样。

本书介绍的统计推断方法,如无特别说明,总体和样本均指无限总体和简单随机样本。

样本的特性:

1)随机性:

由于抽样过程是随机的,所以在具体抽取之前并不能确定到底会抽到哪个个体,组成样本的个体是随机的,因而样本有随机性。

2)确定性:

一旦进行了具体抽样,就会得到一组数据,常称这组数据为样本值。

统计学好比总体与样本间的桥梁:

它帮助人们设计与实施从总体中科学地抽取样本,使样本中的个体不多不少,信息丰富、代表性好(抽样);

帮助人们挖掘样本中的信息,推断总体的规律性(推断);

帮助人们描述样本中观察到的现象,恰当地解释总体中可能存在的规律(描述)。

3、同质与变异

同质(homogeneity):

同一总体的个体,我们称其有同质性。

变异(variation):

同一总体个体间的差异,我们称其为变异。

异质(heterogeneity):

不同总体间个体的差异,我们称其为异质。

4、个体、变量与统计资料类型

观察单位(ObservationUnit)亦称个体,是指被观察或测量对象的最基本单位,可以是一个人、一只鼠、一个样品、一个采样点、一个地区等。

变量:

个体的特性,称变量(Variable),也称随机变量。

变量值是得到的被观察单位该项特征值。

为什么我们称个体的特性为变量?

例:

某研究者设计的一项研究内容是:

将生后17天的30只雌性大鼠分为两组,除了给同样的饲料外,一组给水、一组给被研究的饮品,2周后取子宫秤重。

这项研究中,观察单位是什么?

变量与变量值是什么?

随机变量的特点?

随机变量是研究随机试验的有效工具。

其具有取值的可变性,又具有取值的随机性。

这种双重性是随机变量与普通变量的本质区别。

识别变量的类型非常重要,因为不同类型的变量有不同的统计学分析技术。

对不同类型的变量进行研究,可获得不同类型的统计资料。

变量的分类:

变量分类的方法有多种,教材将变量分为两类:

定性变量(qualitativevariable)

定量变量(quantitativevariable)

定性变量:

(定性资料)

1)无序分类变量(categoricalvariable):

如:

职业、性别、血型等

2)有序变量(ordinalvariable):

疗效、实验室检验等

分类变量也称名义变量

有序变量也称等级变量

定量变量:

定量资料

1)离散型变量(discretevariable)

如家庭子女数、龋齿数等

2)连续型变量(continuousvariable)

如血压、体重、血清胆固醇等

变量的类型

表1.1100名高血压病人治疗后的临床记录

患者年龄性别治疗收缩压舒张压心电图疗效

编号(岁)分组(kPa)(kPa)判定

137男A药18.6711.47正常显效

245女对照20.0012.53正常有效

343男B药17.3310.93正常有效

459女对照22.6714.67异常无效

:

:

10054女B药16.8011.73正常有效

例1.研究洛赛克治疗消化性溃疡的疗效,用泰胃美作对照,原始资料收集如表1.1

表1.1治疗效果记录表

住院号:

______姓名:

________组别:

1.洛2.泰

年龄(岁):

______性别:

______病程(年):

______

溃疡面大小(cm)______

上腹部疼痛:

1.减轻2.未减轻

疗效:

1.治愈2.好转3.有效4.无效

医师:

______日期:

按统计分析分类:

按测量结果分类:

----标识变量----数值变量

----分析变量----分类变量

注意问题:

1)变量类型可依研究目的进行某些变化。

2)定性变量的取值当用代码1、2、3等水平来表示时,这些数仅仅只是代码,不能进行计算。

变量转换(variabletransformation)

1.定量变量的性质化转换。

溃疡面大小(cm)病情

<

2.0轻症

2.0重症

2.定性变量的数量化转换。

(名义变量)

性别:

男=1治疗分组:

试验组=1

女=2对照组=2

统计资料的分类:

1)定量资料

2)定性资料(分类资料)

A、无序分类资料

B、有序分类资料(等级资料)

统计资料的类型

资料类型变量类型例子统计指标

定量资料定量变量

连续型变量12岁男孩身高(cm):

平均数,标准差等

142.3134.2145.2151.2

离散型变量每个病人就诊次数

分类资料定性变量

无序分类某药治疗70个病人的效果率,构成比等

有效:

43例

无效:

27例

有序分类某药治疗70个病人的效果可计算构成比

变量显效:

13例

(等级资料)好转:

30例

5、参数与统计量

参数(parameter):

描述总体特征的指标。

统计量(statistic):

描述样本特征的指标。

举例一:

某地2000年全部正常成年男子的平均红细胞数(m)即为总体参数,而从该总体中随机抽取的144名正常成年男子的平均红细胞数为样本统计量。

举例二:

当林肯第一次当选总统,他赢得了1865908张选票的39.82%。

如果我们将所有这些选票的结果看作总体,则39.82%就是一个参数。

举例三:

在一个有877名被调查者的样本中,发现其中的45%不会雇佣求职申请上有印刷错误的求职者。

45%这个数字是一个统计量。

一般情况下,参数是未知的,需要用统计量去估计。

样本统计量估计总体参数会不会有误差?

误差的特点如何?

误差的类型:

1、系统误差

2、随机误差

3、过失误差

误差:

观察值与真值的差异

参数:

真值,欲了解的值

统计量:

抽样研究获得的观察值

重要概念:

样本统计量与总体参数的误差:

随机误差(随机抽样误差)

为什么会有随机抽样误差?

随机抽样误差存在的原因:

1、个体差异(变异)

2、样本是总体的一部分

为什么?

总统选举民意测验:

1936年,美国总统选举投票前,《文摘》杂志按照电话号码簿和汽车登记簿上的地址寄出了1000万张询问投票倾向的明信片。

根据收回的200万份结果预测共和党候选人兰登将以领先15%的得得票率战胜民主党候选人罗斯福而选总统。

然而选举结果出乎意料,罗斯福反以超过兰登20%的得票率赢得大选当上总统。

《文摘》杂志声誉扫地,不久就被迫关门。

如果样本不能代表总体,则抽样研究除存在随机抽样误差外,还可能存在系统误差(偏倚)。

6、设计与分析

设计(design):

对整个研究的安排、计划,包括如何确定研究个休、如何抽样、抽取多少个体等等一系列问题。

随机化设计;

配对设计;

交叉设计等等。

分析(analysis):

统计分析方法

注意:

一定的设计样式决定了一定的数据分析方法。

7、因果关系与联系

因果关系(causality):

A变量是B变量发生的原因。

A称B的危险因素(riskfactor)

联系(association):

A、B两变量数量上存在联系,则称A、B两变量有联系或关联

关联关系是否就是因果关系?

运动能否改变一个人的寿命?

对这一问题该如何进行研究?

方法:

观察性研究

美国一研究中心对这一问题进行了研究:

1、评价了25341名男性和7080名女性;

2、所有参加者在1970—1989年间接受基线检查:

体检、实验室检测、踏车试验评价身体适宜运动量

3、男性平均追踪观察8.4年,女性7.5年。

生存(男)死亡(男)生存(女)死亡(女)

n=24740n=601n=6991n=89

年龄42.7(9.7)52.1(11.4)42.6(10.9)53.3(11.2)

运动量%

低20.141.618.844.9

中42.039.140.633.7

高37.919.340.621.3

收缩压

121.1(13.5)130.4(19.1)112.6(14.8)122.6(17.3)

吸烟%

26.336.918.530.3

体重指数

Kg/cm226.3(3.6)26.3(3.5)22.6(14.8)23.7(4.5)

由表可见:

1)男性与女性运动级别中,存活者和死亡者之间有明显区别。

故运动与死亡存在联系。

2)上表能否回答运动是寿命延长的原因?

在此研究中,年龄、收缩压、吸烟、体重指数称为混杂变量,由于混杂的存在,使我们对因果关系的确定变的困难和复杂。

混杂变量(confounder):

也称混杂因素(confoundingfactor),一个变量成为混杂因素,它必须和危险因素有关,并且和结果具有因果关系。

8、概率(probability)与频率(relative)

概率是描述随机事件发生可能性大小的一个度量。

设在相同条件下,独立地重复n次试验,随机事件A出现了f次,则称比值

f/n为随机事件A出现的频率。

当n逐渐增大时,频率f/n始终在一个常数左右作微小摆动,则称该常数为随机事件A的概率,记为P(A)或P。

历史上有人所做投掷硬币试验:

实验者投掷次数

正面次数频率

Buffon404020480.5069

K.person1200060190.5016

K.person24000120120.5005

随机事件的概率的大小介于0与1之间,常用小数或百分数表示。

在实际工作中,可将频率作为概率的估计值。

但在观察单位较少时,频率的波动性很大,用于估计概率是不可靠的。

卫生统计学中的许多结论都是根据概率得到的。

一般常将P£

0.05或P£

0.01称为小概率事件。

小概率事件在一次试验中一般不会发生。

小概率事件举例:

已知12岁男孩身高小于148厘米的概率是2.3%,现随机抽取一12岁男孩,一般可推断其身高大于148厘米。

某药出现胃肠道不良反应的概率小于0.1%,今10人服用此药,可推断没人会出现胃肠道不良反应[P(X>

0)<

1%]

“概率是参数,频率是统计量”,此话对否?

统计学的几个基本概念总结

(1)原始数据的检查核对

这部分工作应在调查现场时做,以便及时更正。

(2)数据库中的数据检查与核对

数据的取值范围检错

数据间的逻辑关系检错

手动测量与自动测量的血压值比较研究

手动测量与自动测量的血压值比较研究

两种仪器测量的平均血压值比较

2.确定研究总体与观察个体(胖瘦、年龄、性别、既往血压)

3.样本含量的估计(100例)

4.采用两种方法测量血压(资料搜集)

5、数据录入,建立数据库(取值范围和逻辑关系的检错)

6.统计分析(计算平均血压,假设检验等)

本章内容:

1、统计学概念及分类(一般了解)

2、几个基本概念(重点掌握)

3、第三节内容自学。

几个基本概念

假如某地区在2000年共有10万个12岁正常女孩的身高情况,可以采用普查或抽样调查的方法。

如用抽样调查方法,从10万个12岁正常女孩中随机抽取100个对象,测量她们的身高,通过分析这100个女孩的身高,推断该地区10万个12岁正常女孩的身高情况。

在这个研究中涉及如下基本概念:

研究目的:

2000年某地区12岁正常女孩的身高情况。

研究对象:

2000年该地区10万个12岁正常女孩。

观察单位:

研究对象中的每个12岁正常女孩,也称个体。

观察指标:

身高(观察指标也称变量)。

观察值:

身高的测量值,也称变量值。

随机:

在这10万个12岁正常女孩中,每个对象被抽取的机会均等。

总体:

2000年该地10万个12岁正常女孩身高值的全体。

随机抽取的100个12岁正常女孩身高值构成的集全。

个体变异:

总体中12岁正常女孩身高值之间的差异。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2