316统计学计量资料的统计描述方法文档格式.docx
《316统计学计量资料的统计描述方法文档格式.docx》由会员分享,可在线阅读,更多相关《316统计学计量资料的统计描述方法文档格式.docx(10页珍藏版)》请在冰点文库上搜索。
Xn
2
(2)
(亍+1)
9人数据:
12,13,14,14,15,15,15,17,19天
M=X9厂X15(天)
如果只调查了前八位中学生,贝y:
M=.8十X82=(X4+X)2=(14+15)/2=14.5(天)
——+1/
<
22丿/
B.百分位数
是将N个观察值从小到大依次排列,再分成100等份,对应于
X%i的数值即为第X百分位数。
中位数是第百分50位数。
四分位数间距(quartilerange/
=第25百分位数(P23〜第75百分位数(P73。
四分位数间距用于描述偏态资料的分散程度(代替标准差S),包
含了全部观察值的一半。
百分位数计算(频数表法):
Px=Lx;
x(nX%-二fL)
fX
Lx:
第X百分位数所在组段下限EfL:
小于LX各组段的累计频数
ix:
第x百分位数所在组段组距n:
总例数fx:
所在组段频数
注:
有的教材X=r;
[fL=C
例:
求频数表的第25、第75百分位数(四分位数间距)
组段
频数f
累积频数刀f
56〜
59〜
5
7
62〜
12
19
刀f25
L2565〜
15
34
P25在此
68〜
25
59
71〜
26
85
刀f75
L7574〜
104
P75在此
77〜
119
80〜
10
129
83〜85
130
合计
1确定Px所在组段:
P25所在的组段:
nX%=130X25%=32.5,
65〜组最终的累积频数=34,32.5落在65〜组段内;
P75所在的组段:
nX%=130X75%=97.5,此值落在74〜组段
2确定Px所在组段的LX、iX、fx、EfL
3P25=65+3x[(130x25%—19)/15]=65.90
P75=74+3x[(130x75%—85)/19]=74.66
四分位数间距=65.90〜74.66(次份)
3.几何均数G(geometricmean
应用:
适用于成等比数列的资料,特别是服从对数正态分布资料。
原始数据分布不对称,经对数转换后呈对称分布的资料。
可用于反映一组经对数转换后呈对称分布或正态分布的变量值
在数量上的平均水平。
例如抗体滴度。
计算:
N个数值的乘积开N次方,即为这N个数的几何均数。
G"
XiX2“|Xn
1ZlgX
lgG(IgXilgX2IIIIgXA
G廿「lgX
n
Ig表示以10为底的对数;
Ig_1表示以10为底的反对数
X0为正值
有8份血清的抗体效价分别为1:
5,1:
10,1:
20,1:
40,1:
80,1:
160,1:
320,1:
640,求平均
抗体效价。
使用分母计算!
G=8'
510204080160320640=56.57
Glg[(lg5lg10lg20川lg640)/8]56.57
平均抗体效价为:
1:
57
加权法:
组段的组中值。
适用于大样本但较粗糙。
有16例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试
求众数。
正态分布时:
均数=中位数=众数
正(右)偏态分布时:
均数>
中位数>
众数负(左)偏态分布时:
均数<
中位数<
众数
3.标准差S
S描述数据的分散程度.描述一组数据在其平均数周围的分布情
况,若每个数据集中在其平均数周围,此平均数对这组数据的代表照就大;
反之,代表性较差。
标准差S
甲
组乙
75
80
90
95
100
105
n1=7
X1=90
S1=10.8
组
45
60
120
135
n2=7
X2=90
S2=32.4
s-x-x数据越分散,分子越大。
或者
\n-1
标准差的5应用:
描述变异程度、计算标准误、计算变异系数、
描述正态分布、估计正常值范围
s用于正态分布资料
怎样使用均数和标准差?
论文中常用X士S描述对称、正态或近似正态分布数据的特征。
描述偏态资料的分散程度需用四分位数间距P25-P75(代替标准差S)
方差:
万差二S2
全距R:
R=最大值-最小值。
简单,但仅利用了两端点值,稳定性差
变异系数(coefficientofvariation,CV):
CV=(S/X)沃100%无单位
1.单位不同的多组数据比较;
2.均数相差悬殊的多组资料
什么是正态分布?
(二)正态分布(Normaldistributer)
正态分布是描述连续型变量值分布的曲线.当例数比较多时,医
学上许多资料近似服从正态分布。
正态分布在统计推断上有重要的作
(1>
⑵
频数分布与正态分布曲线示意图|
正态分布曲线理论上的特征
(1)以X=□均数为中心,X值呈钟型分布,中央高、两端对称性减少、与X轴永不相交。
(2)在X=□处,f(x)取最大值(例数最多)。
(3)正态分布由均数卩、标准差。
决定曲线的左右位置和高低形
状:
正态分布有两个参数,即位置参数--均数」和形态参数--标准差二。
若固定标准差二,改变均数■值,曲线沿着X轴平行移动,其形状不变。
若固定卩,▽越小,曲线形状越陡峭;
反之,▽越大,曲线越平坦。
正态分布均数(位置参数)、标准差(变异度)变化示意图
正态曲线面积分布规律:
1X轴与正态曲线所夹面积恒等于1或100%
2区间的面积为68.27%;
3区间J_1.96二的面积为95.00%;
4区间」_2.58匚的面积为99.00%。
正态分布u值表(标准正态分布概率单位值)
变量值分布范围(%)
尾部面积
a
单侧u值
双侧u值
0.20
0.84
1.28
0.10
1.64
0.05
1.96
99
0.01
2.33
2.58
尾部面积为a的u值,记为ua,称为U界值:
尾部面积各为2.5%时(黑色处),其对应的u值为u=±
1.96;
u=(-2.58,2.58)区间的面积为0.99(空白处)
正态分布的应用:
1.估计正态分布X值在特定值范围内的分布比例(概率)
2.制定某临床指标的参考值范围
3.利用估计变量值的范围或对极端值做取舍。
4.许多统计方法的统计推断建立在正态分布基础上。
怎样确定资料是否属正态分布?
1.做正态性检验;
2.粗略估计:
正态一般S丿X;
SX者必为偏态!
3
正态分布可用于求参考值范围!
(三)医学参考值范围的制定
概念医学参考值是指包括绝大多数“正常人”的各种生理及生化指标常数,也称正常值(背景值)。
正常值是指在一定范围内波动的值,医学上常用95%勺范围作为
判定正常或异常的参考标准。
制定参考值的基本原则
1.选定正常人:
即排除了影响研究指标的有关因素的同质人群。
有足够的样本例数(一般不低于100例)
2.确定参考值范围的百分界限(常用95%
3.考虑制定单侧或双侧诊断界值:
新药肯定比旧药好(旧药肯定比新药差)单侧
新药可能好,也可能差双侧
双侧标准较高,结论较可靠(常用)
4.依分布(正态或偏态)确定计算方法:
(1)正态分布法
X±
u?
s,其中
双侧95%参考值范围公式:
1.96S
单侧95%参考值范围公式:
X+1.64S
例11.3:
已知111人的血铅X=0.010(g/100ml,S=0.012g/100ml
因为血铅可以低而不可以高,故用单侧95%参考值范围
X+1.64S=0.010+1.64X0.012=0.030(g/100ml);
血铅95%参考值范围<0.030g/100ml
注意:
如果资料非正态分布而使用正态分布法,会得出错误结论!
!
(2)百分位数法
适用于偏态分布资料
计算公式:
双侧界值:
P2.5〜P97.5单侧用上界:
P95单侧用下界:
P5