316统计学计量资料的统计描述方法文档格式.docx

资源描述

316统计学计量资料的统计描述方法文档格式.docx

《316统计学计量资料的统计描述方法文档格式.docx》由会员分享，可在线阅读，更多相关《316统计学计量资料的统计描述方法文档格式.docx（10页珍藏版）》请在冰点文库上搜索。

316统计学计量资料的统计描述方法文档格式.docx

（2）

（亍+1）

9人数据：

12,13,14,14,15,15,15,17,19天

M=X9厂X15（天）

如果只调查了前八位中学生，贝y：

M=.8十X82=（X4+X）2=（14+15）/2=14.5（天）

——+1/

22丿/

B.百分位数

是将N个观察值从小到大依次排列，再分成100等份，对应于

X%i的数值即为第X百分位数。

中位数是第百分50位数。

四分位数间距（quartilerange/

=第25百分位数（P23〜第75百分位数（P73。

四分位数间距用于描述偏态资料的分散程度（代替标准差S）,包

含了全部观察值的一半。

百分位数计算（频数表法）：

Px=Lx；

x（nX%-二fL）

Lx:

第X百分位数所在组段下限EfL:

小于LX各组段的累计频数

ix:

第x百分位数所在组段组距n:

总例数fx：

所在组段频数

注：

有的教材X=r;

[fL=C

例：

求频数表的第25、第75百分位数（四分位数间距）

组段

频数f

累积频数刀f

56〜

59〜

62〜

刀f25

L2565〜

P25在此

68〜

71〜

刀f75

L7574〜

104

P75在此

77〜

119

80〜

129

83〜85

130

合计

1确定Px所在组段：

P25所在的组段：

nX%=130X25%=32.5,

65〜组最终的累积频数=34,32.5落在65〜组段内；

P75所在的组段：

nX%=130X75%=97.5，此值落在74〜组段

2确定Px所在组段的LX、iX、fx、EfL

3P25=65+3x[（130x25%—19）/15]=65.90

P75=74+3x[（130x75%—85）/19]=74.66

四分位数间距=65.90〜74.66（次份）

3.几何均数G（geometricmean

应用：

适用于成等比数列的资料，特别是服从对数正态分布资料。

原始数据分布不对称，经对数转换后呈对称分布的资料。

可用于反映一组经对数转换后呈对称分布或正态分布的变量值

在数量上的平均水平。

例如抗体滴度。

计算：

N个数值的乘积开N次方，即为这N个数的几何均数。

XiX2“|Xn

1ZlgX

lgG（IgXilgX2IIIIgXA

G廿「lgX

Ig表示以10为底的对数；

Ig_1表示以10为底的反对数

X0为正值

有8份血清的抗体效价分别为1:

5,1:

10,1:

20,1:

40,1:

80,1:

160,1:

320,1:

640,求平均

抗体效价。

使用分母计算！

G=8'

510204080160320640=56.57

Glg[（lg5lg10lg20川lg640）/8]56.57

平均抗体效价为：

加权法：

组段的组中值。

适用于大样本但较粗糙。

有16例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62，试

求众数。

正态分布时：

均数=中位数=众数

正（右）偏态分布时：

均数>

中位数>

众数负（左）偏态分布时：

均数<

中位数<

众数

3.标准差S

S描述数据的分散程度.描述一组数据在其平均数周围的分布情

况，若每个数据集中在其平均数周围，此平均数对这组数据的代表照就大；

反之，代表性较差。

标准差S

甲

组乙

100

105

n1=7

X1=90

S1=10.8

组

120

135

n2=7

X2=90

S2=32.4

s-x-x数据越分散，分子越大。

或者

\n-1

标准差的5应用：

描述变异程度、计算标准误、计算变异系数、

描述正态分布、估计正常值范围

s用于正态分布资料

怎样使用均数和标准差?

论文中常用X士S描述对称、正态或近似正态分布数据的特征。

描述偏态资料的分散程度需用四分位数间距P25-P75（代替标准差S）

方差：

万差二S2

全距R:

R=最大值-最小值。

简单，但仅利用了两端点值，稳定性差

变异系数（coefficientofvariation,CV）:

CV=（S/X）沃100%无单位

1.单位不同的多组数据比较；

2.均数相差悬殊的多组资料

什么是正态分布？

（二）正态分布（Normaldistributer）

正态分布是描述连续型变量值分布的曲线.当例数比较多时，医

学上许多资料近似服从正态分布。

正态分布在统计推断上有重要的作

（1>

⑵

频数分布与正态分布曲线示意图|

正态分布曲线理论上的特征

（1）以X=□均数为中心，X值呈钟型分布，中央高、两端对称性减少、与X轴永不相交。

（2）在X=□处，f（x）取最大值（例数最多）。

（3）正态分布由均数卩、标准差。

决定曲线的左右位置和高低形

状：

正态分布有两个参数，即位置参数--均数」和形态参数--标准差二。

若固定标准差二，改变均数■值，曲线沿着X轴平行移动，其形状不变。

若固定卩，▽越小，曲线形状越陡峭；

反之，▽越大，曲线越平坦。

正态分布均数（位置参数）、标准差（变异度）变化示意图

正态曲线面积分布规律：

1X轴与正态曲线所夹面积恒等于1或100%

2区间的面积为68.27%;

3区间J_1.96二的面积为95.00%;

4区间」_2.58匚的面积为99.00%。

正态分布u值表（标准正态分布概率单位值）

变量值分布范围（%）

尾部面积

单侧u值

双侧u值

0.20

0.84

1.28

0.10

1.64

0.05

1.96

0.01

2.33

2.58

尾部面积为a的u值，记为ua,称为U界值：

尾部面积各为2.5%时（黑色处），其对应的u值为u=±

1.96;

u=（-2.58,2.58）区间的面积为0.99（空白处）

正态分布的应用：

1.估计正态分布X值在特定值范围内的分布比例（概率）

2.制定某临床指标的参考值范围

3.利用估计变量值的范围或对极端值做取舍。

4.许多统计方法的统计推断建立在正态分布基础上。

怎样确定资料是否属正态分布？

1.做正态性检验；

2.粗略估计：

正态一般S丿X;

SX者必为偏态！

正态分布可用于求参考值范围！

（三）医学参考值范围的制定

概念医学参考值是指包括绝大多数“正常人”的各种生理及生化指标常数，也称正常值（背景值）。

正常值是指在一定范围内波动的值，医学上常用95%勺范围作为

判定正常或异常的参考标准。

制定参考值的基本原则

1.选定正常人：

即排除了影响研究指标的有关因素的同质人群。

有足够的样本例数（一般不低于100例）

2.确定参考值范围的百分界限（常用95%

3.考虑制定单侧或双侧诊断界值：

新药肯定比旧药好（旧药肯定比新药差）单侧

新药可能好，也可能差双侧

双侧标准较高，结论较可靠（常用）

4.依分布（正态或偏态）确定计算方法：

（1）正态分布法

X±

s,其中

双侧95%参考值范围公式：

1.96S

单侧95%参考值范围公式：

X+1.64S

例11.3:

已知111人的血铅X=0.010（g/100ml,S=0.012g/100ml

因为血铅可以低而不可以高，故用单侧95%参考值范围

X+1.64S=0.010+1.64X0.012=0.030（g/100ml）;

血铅95%参考值范围＜0.030g/100ml

注意：

如果资料非正态分布而使用正态分布法，会得出错误结论！

！

（2）百分位数法

适用于偏态分布资料

计算公式：

双侧界值：

P2.5〜P97.5单侧用上界：

P95单侧用下界：

展开阅读全文