医学统计学第七版课后解析Word下载.docx
《医学统计学第七版课后解析Word下载.docx》由会员分享,可在线阅读,更多相关《医学统计学第七版课后解析Word下载.docx(7页珍藏版)》请在冰点文库上搜索。
10、参数:
描述总体特征的量
11、统计量:
根据样本个体值计算得到的描述样本特征的量
12、总体参数是常数,而样本统计量可随样本不同而不同
13、随机误差:
指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起
14、抽样误差:
指抽样引起的样本统计量与总体参数之间的差异
15、系统误差:
在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差
16、过失误差:
指各种失误所导致的误差
17、随机事件:
在一定条件下某一现象可能发生也可能不发生的事件
18、概率:
反映某一随机事件发生可能性大小的量,用符号P表示
19、小概率事件:
统计学上一般把P≤0.05的事件称为小概率事件,表示某事件发生的可能性很小
20、变量:
观察单位的某个特征
21、变量值:
变量的观察结果或测定值
22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量
23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料
24、分类变量又称定性变量,其变量值是用定性方法测得的
25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)
25、医学统计工作的基本步骤:
一、设计;
二、收集资料;
三、整理资料;
四、分析资料
26、统计表和统计图是描述统计资料的重要工具
27、统计表的结构:
①标题位于统计表的上中方
②标目用来说明表内各纵横数字的含义,注意标明指标的单位。
根据其位置与作用分为横标目、纵标目、总标目。
③线条仅使用横线,不使用竖线和斜线。
常用三条基本线表示,即顶线、底线和纵标目线,如有合计用横线隔开。
④数字用阿拉伯数字表示
⑤备注
28、统计表的种类:
简单表和组合表
29、编制统计表应注意的事项:
①重点突出,简单明了。
一般只包含一个中心内容
②主谓分明,层次清楚。
即横纵标目的安排要得当,标目排列秩序符合逻辑和习惯
30、统计图有:
条图、百分条图、圆图、线图、半对数线图、散点图、直方图等
31、绘制统计图的基本要求:
①按资料的性质和分析目的选用适当的图形
②要有标题,概括统计图的主要内容,标题一般位于图的下方
③一般有横、纵标目。
条图与直方图纵坐标要从零开始,中间不能折断。
④图的横纵比例一般为7:
5或5:
7
⑤比较不同事物时,宜选用不同的线条或颜色表示,并附图例加以说明。
32、编制频数表的步骤:
①计算极差②确定组数、组段和组距③列表划记
33、频数分布表和频数分布图的用途(作用):
(1)可将原来相对杂乱的数据以相对直观、有序的表格或图形的形式描述,便于进一步分析。
(2)便于观察数据频数分布的类型,以便根据资料分布类型选择恰当的统计分析方法。
(3)用于描述频数分布的特征,即集中趋势和离散趋势。
(4)便于发现资料中一些特大或特小的可疑值,以进一步检查和核对。
34、平均数:
是描述一组变量值的集中趋势或平均水平的统计指标,是统计学中最重要和应用最广泛的统计学指标之一。
常用的平均数有算术均数、几何均数、中位数。
35、算术均数:
简称均数,可用于反应一组呈对称分布的变量值在数量上的平均水平。
总体均数用希腊字母μ表示,样本均数用x表示。
36、几何均数:
用G表示,用于反映一组经对数转换后呈对称分布或数据之间呈倍数关系或近似倍数关系资料的平均水平。
适用于抗体的平均滴度、平均抗体效价等。
37、中位数:
用M表示是将一组观察值按从小到大的顺序排列后,位次居于中间的那个数值。
38、百分位数:
是一种位置指标。
将n个观察值从小到大排列,分成一百等份,各等份含1%的观察值,和第x百分位次对应的数值称为第x百分位数。
39、变异(即个体差异)是生物医学数据最显著的特征。
描述数据变异程度(离散趋势)常用的统计指标有全距、四分位数间距、方差、标准差和变异系数。
40、全距:
观察值中的最大值和最小值之差称为极差或全距,用R表示
41、四分位数间距:
就是上四分位数与下四分位数之差,即P75—P25
42、方差:
是描述所有观察值与均数的平均离散程度的指标,表示一组数据的平均离散程度
43、同类资料比较,方差越大,意味着数据间离散程度越大(即变异程度越大)
44、标准差:
是方差的正平方根。
45、标准差的用途:
(1)反应一组资料的离散程度,标准差越大,变量值分布越分散均数的代表性越差,反之亦然;
(2)用于计算变异系数;
(3)用于计算标准误;
(4)结合均数与正态分布的规律,估计参考值范围
46、变异系数:
用CV表示,即标准差与算术均数之比,描述了观察值的变异相对于其平均水平的大小
47、正态分布的特征:
(1)正态曲线在横轴上方,呈钟型曲线,两端与横轴永不相交
(2)正态分布以均数为中心,均数所在处最高,左右对称,正态曲线在X=μ±
σ处有拐点
(3)正态分布有两个参数,即均数与标准差(μ与σ);
其中均数为位置参数,若σ恒定,改变μ的值,曲线沿横轴平行移动,形状不变;
标准差为形状参数,若μ恒定,则σ越大,曲线越平坦,反之曲线越陡峭
(4)正态分布曲线下的面积分布有一定的规律性
48、正态分布与标准正态分布曲线下的面积分布规律
正态分布标准正态分布面积(或概率)
μ-1σ~μ﹢1σ-1~168.27%
μ-1.96σ~μ﹢1.96σ-1.96~1.9695.00%
μ-2.58σ~μ﹢2.58σ-2.58~2.5899.00%
49、正态分布的应用:
(1)估计变量值的频数分布;
(2)制定参考值范围;
(3)质量控制;
(4)正态分布是很多统计方法的基础;
50、标准误:
为了与反映观察值离散程度的标准差相区别,统计学中把样本均数的标准差称为样本均数的标准误,简称标准误。
51、标准误的意义:
是描述均数的抽样误差大小的统计指标。
均数的标准误越大,均数的抽样误差就越大,说明样本均数的离散程度高,与总体均数的差异程度大。
52、标准误的用途:
(1)可用来衡量样本均数的可靠性。
均数标准误越小,说明样本均数与总体均数的差异程度越小,因此用此样本均数估计总体均数越可靠,反之亦然
(2)与样本均数结合,可用于估计总体均数的置信区间
(3)可用于进行均数的假设检验
53、假设检验的目的:
根据样本信息推测总体特征之间是否有差异
54、t检验的应用条件:
当样本例数n较小,样本来自正态总体,总体标准差未知。
在做两个样本均数比较时,还要求两样本相应的总体方差相等。
55、应用方差分析的条件:
(1)各样本是相互独立的随机样本
(2)各样本都来自正态总体
(3)各个总体方差相等
56、方差分析的基本思想:
把全部观察值之间的变异---总体变异,按设计和需要分为两个或多个部分,其自由度也分解为相应的部分。
每一部分都有一定的意义,其中国至少有一部分表示各组均数间的变异另一部分表示误差。
然后再计算变异间的比值F。
若F值接近1,可认为处理素材无作用;
若F值远大于1,且大于或等于F界值表中的某界值时,可认为处理因素有作用。
57、相对数:
两个有关联的数值或指标之比
58、通常用相对数来描述分类变量资料的特征,常用相对数有率、构成比和相对比
59、率:
为频率指标,是指在一定观察时间内某现象实际发生数与可能发生发生该现象的总数之比,用以说明某现象发生的频率或强度
60、构成比:
是指事物内幕某一部分的观察单位数与事物内部组成部分的观察单位数总和之比,用以说明事物内部各部分所占的比例或分布。
61、相对比:
指两个有关指标之比,说明两个指标的比例关系
62、应用相对数时的注意事项:
(1)计算率或构成比时分母不宜过小
(2)正确区分构成比和(3)正确计算平均率
(4)注意资料的可比性(5)样本率或样本构成比进行比较时要做假设检验
63、率的标准化法的基本思想:
将两组资料的构成统一按某个标准进行校正,以消除内部构成不同对总率的影响
64、四格表资料的应用条件:
(1)T≥5,且n≥40时,直接计算x²
值,不用校正
(2)1≤T<5,且n≥40时,用连续性校正x²
检验
(3)T<1或n<40,不能用x²
检验,用直接计算概率的方法
65、直线相关:
又称简单相关,是探讨服从正态分布的两个随机变量X和Y有无直线相关关系的一种统计方法。
两变量的直线相关关系用相关系数表示,又称Pearson积差相关系数,是描述两个变量间直线相关的密切程度与方向的统计指标
66、直线回归:
又称简单回归,是用直线回归方程来描述两个连续性变量X和Y之间数量依存关系的一种统计分析方法
67、直线回归方程的应用:
(1)描述两变量间的数量依存关系
(2)利用回归方程进行预测(3)利用回归方程进行统计控制
68、应用直线回归方程时注意的问题:
(1)两变量作直线回归分析时,要求应变量Y服从正态分布,通常自变量X为可以精确测量或严格控制的因素;
(2)作回归分析时要有实际意义;
(3)在进行回归分析前,要绘制散点图;
(4)回归方程适用范围一般以自变量X实际取值范围为限,不能任意外推
69、编秩:
要求会编秩