数理统计.docx
《数理统计.docx》由会员分享,可在线阅读,更多相关《数理统计.docx(20页珍藏版)》请在冰点文库上搜索。
数理统计
数理统计实习报告
科目:
数理统计
姓名:
张轶
学号:
2002009039
队别:
研究生管理大队二队
专业:
免疫学
实验报告一分布拟合检验
一、问题:
调查某地区恶性肿瘤的死亡率,对该地区350个自然村进行660次独立的调查,将各村的3年累计死亡率(‰)取整数值作为随机变量见于下表资料,试判断该数据是否符合Poisson分布?
二、数据
某地区恶性肿瘤3年累计死亡率数据资料
Deathlevel(‰)
Frequency
0
98
1
178
2
198
3
111
4
42
5
19
6
10
7
3
8
1
Total
660
三、统计处理:
该实际问题涉及到一个离散型随机变量:
特定死亡率的频数,根据实验数据及处理目的,对其进行单样本Poisson分布拟合检验。
下面选用EXCEL和SPSS软件进行分析。
四、结果及分析:
1、相关结果分析:
先用EXCEL求各取值的概率
0
98
0
0.14808
14.80804
1
178
178
0.282834
28.28335
2
198
396
0.270106
27.0106
3
111
333
0.171968
17.19675
4
42
168
0.082114
8.211448
5
19
95
0.031368
3.136773
6
10
60
0.009985
0.998539
7
3
21
0.002725
0.272459
8
1
8
0.00065
0.065049
死亡率
个数
1259
99.98302
DescriptiveStatistics
N
Mean
Std.Deviation
Minimum
Maximum
死亡率
660
1.91
1.397
0
8
死亡率
ObservedN
ExpectedN
Residual
0
98
97.8
.2
1
178
186.7
-8.7
2
198
178.3
19.7
3
111
113.5
-2.5
4
42
54.2
-12.2
5
19
20.7
-1.7
6
10
6.6
3.4
7
3
1.8
1.2
8
1
.4
.6
Total
660
TestStatistics
死亡率
Chi-Square
9.029a
df
8
Asymp.Sig.
.340
a.2cells(22.2%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequencyis.4.
2、结论:
从上表知P值为0.340>0.05,无法拒绝原假设,可以认为该地区350个村的3年累计死亡率(‰)的660个整数取值是服从Poisson分布。
实验报告二两正态总体的均值比较
一、问题:
某高原研究组将籍贯相同、年龄相同、体重接近的20名新战士随机分为锻炼组和对照组,锻炼组每天除常规训练外,接受中速长袍与健身操锻炼,对照组按常规训练,一月后测定肺活量,得到下表的数据,若已知两组肺活量均服从正态分布,试判断:
锻炼组和对照组的肺活量的总体均数是否相同?
(取α=0.05)
二、数据
序号
1
2
3
4
5
6
7
8
9
10
锻炼组
4.41
4.88
4.46
3.98
4.78
4.46
3.93
4.01
4.18
4.08
对照组
3.32
4.44
4.32
3.44
3.86
3.98
3.98
3.96
4.05
3.56
三、统计处理:
该问题涉及两正态总体样本,分别设:
锻炼组肺活量均值为μ1,对照组肺活量均值为μ2。
检验假设H0:
μ1=μ2,H1:
μ1≠μ2。
下面用SPSS软件进行两正态总体均值比较处理。
Group是组别,锻炼组是第1组,对照组是第2组。
四、结果及分析:
1、相关结果分析:
GroupStatistics
group
N
Mean
Std.Deviation
Std.ErrorMean
肺活量
1
10
4.3170
.33556
.10611
2
10
3.8910
.36075
.11408
IndependentSamplesTest
Levene'sTestforEqualityofVariances
t-testforEqualityofMeans
95%ConfidenceIntervaloftheDifference
F
Sig.
t
df
Sig.(2-tailed)
MeanDifference
Std.ErrorDifference
Lower
Upper
肺活量
Equalvariancesassumed
.003
.960
2.734
18
.014
.42600
.15580
.09867
.75333
Equalvariancesnotassumed
2.734
17.906
.014
.42600
.15580
.09855
.75345
2、结论:
从上表中可以看出,方差齐性的检验里P=0.960>0.05因此认为数据的方差具有齐性。
且T检验P=0.014/2<0.05,因此拒绝
,接受
,认为锻炼组与对照组的肺活量有显著性差别。
实验报告三R×C列联表分析
一、问题:
下表是某作战部队在不同战期破伤风的发生和死亡情况,试比较各战期战士破伤风病死率有无显著性差别。
(取α=0.05)
二、数据
战期
死亡人数
存活人数
合计
第一战期
第二战期
第三战期
28
7
12
14
16
10
42
23
22
合计
47
40
87
三、统计处理:
该研究涉及两个变量的计数数据,构成一个3×2列联表。
依据题设要求检验两变量的独立性,先对因此选用SPSS统计软件,先对计数数据进行加权再使用交叉表统计中的卡方检验对数据进行处理。
H0:
pij=pi+*p+j对于所有i,j成立
H1:
pij
pi+*p+j对于某固定i,j成立
四、结果及分析:
1、相关结果分析:
表1:
Chi-SquareTests
Value
df
Asymp.Sig.(2-sided)
PearsonChi-Square
7.858a
2
.020
LikelihoodRatio
7.993
2
.018
Linear-by-LinearAssociation
1.808
1
.179
NofValidCases
87
a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis10.11.
表2:
表3:
战期*死亡与否Crosstabulation
死亡与否
Total
1
2
战期
1
Count
28
14
42
ExpectedCount
22.7
19.3
42.0
Residual
5.3
-5.3
Std.Residual
1.1
-1.2
AdjustedResidual
2.3
-2.3
2
Count
7
16
23
ExpectedCount
12.4
10.6
23.0
Residual
-5.4
5.4
Std.Residual
-1.5
1.7
AdjustedResidual
-2.6
2.6
3
Count
12
10
22
ExpectedCount
11.9
10.1
22.0
Residual
.1
-.1
Std.Residual
.0
.0
AdjustedResidual
.1
.0
Total
Count
47
40
87
ExpectedCount
47.0
40.0
87.0
2、结论:
从表1可以看到P=0.020<0.05,因此拒绝
,认为这三个战期破伤风病死率有显著性差异。
再看表2,
>
>
因此第一战期病死率最高,第二战期最低,且
=2.3>1.96,及
=2.6>1.96,说明一、二战期病死率对对立性有显著性差异。
实验报告四方差分析
一、问题:
有三种抑制血管药物,通过其抑制程度、血管密度、增生情况、持续时间等对其进行评测,下列数据是对三种药物临床检测的数据,根据以往经验,检测结果服从正态分布,并且方差具有齐性。
试检验三类药物在抑制血管的检测结果有无显著差异?
取a=0.05。
二、数据:
评测指标
药物一
0.263
0.238
0.248
0.245
0.243
药物二
0.257
0.253
0.255
0.254
0.261
药物三
0.258
0.264
0.267
0.262
0.262
三、统计处理:
该问题属于两正态总体方差未知但具有齐性的均值检验,用SPSS软件中的独立样本T检验对数据进行处理。
H0:
μ1=μ2=μ3,H1:
μ1、μ2、μ3不完全相等。
四、结果及分析
1.相关分析结果
PostHocTests
HomogeneousSubsets
2、结论:
方差齐性检验:
方差齐性检验结果可知,
>0.05。
认为方差具有齐性。
方差分析:
<0.05,拒绝原假设。
因此三种药物抑制血管效果的总体均数至少有部分不相等。
实验报告三回归分析
一、问题:
为探讨缺碘地区母婴TSH水平的关系,应用免疫放射分析测定了160对孕妇(15-17周)及分娩时脐带血TSH水平(mU/L),现随机抽取10对数据见下表,试求脐带血TSH水平Y对母血的直线回归方程。
二、数据:
编号
1
2
3
4
5
6
7
8
9
10
母血TSH水平X
1.21
1.30
1.39
1.42
1.47
1.56
1.68
1.72
1.98
2.10
脐带血TSH水平Y
3.90
4.50
4.20
4.83
4.16
4.93
4.32
4.99
4.70
5.20
三、统计处理:
本问题属于一元线性回归分析问题,涉及两个连续型随机变量:
自变量母血TSH水平及因变量脐带血TSH水平,根据实验数据和处理目的,我们首先对其进行相关性分析,随后进行一元线性回归分析,采用的是SPSS中”Analyze”菜单下”Regression”中”LinearRegression”进行数据处理。
四、结果及分析
1.相关分析结果
表一DescriptiveStatistics
Mean
Std.Deviation
N
Y
4.5730
.42277
10
X
1.5830
.28856
10
表二Correlations
Y
X
PearsonCorrelation
Y
1.000
.681
X
.681
1.000
Sig.(1-tailed)
Y
.
.015
X
.015
.
N
Y
10
10
X
10
10
表三ModelSummaryb
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
ChangeStatistics
RSquareChange
FChange
df1
df2
Sig.FChange
1
.681a
.463
.396
.32848
.463
6.908
1
8
.030
a.Predictors:
(Constant),X
b.DependentVariable:
Y
表四ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
.745
1
.745
6.908
.030a
Residual
.863
8
.108
Total
1.609
9
a.Predictors:
(Constant),X
b.DependentVariable:
Y
表五Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
2.994
.610
4.912
.001
X
.997
.379
.681
2.628
.030
a.DependentVariable:
Y
表六ResidualsStatisticsa
Minimum
Maximum
Mean
Std.Deviation
N
PredictedValue
4.2010
5.0886
4.5730
.28779
10
Residual
-.34974
.41956
.00000
.30969
10
Std.PredictedValue
-1.293
1.792
.000
1.000
10
Std.Residual
-1.065
1.277
.000
.943
10
a.DependentVariable:
Y
表七-表九
2、结论:
从表一我们可以得到两个考察对象的一些相关描述性统计量:
如平均值、标准差、样本容量等。
表二是一个相关性检验结果:
两个变量间相关系数为0.681,且P<0.05,由相关性统计假设:
,因此在α=0.05水平下,拒绝原假设,接受备择假设:
,认为母血TSH水平和脐带血TSH水平间具有一定的相关性。
从表五我们可以得到母血TSH水平和脐带血TSH水平间的一元线性回归方程:
Y=2.994+0.997X
该回归方程效果的好坏可以由表三和表四检验得结果:
由表三可知回归可决系数R2=0.681,由表四知道关于自变量X的系数是否为零的检验中,其P值小于0.05,故我们认为在α=0.05水平下,回归方程的线性回归效果显著,从而我们也就认为在置信水平为0.05下,该直线回归方程具有一定的统计学意义,可以用测得的母血TSH水平去预报脐带血TSH水平的水平含量。
表七是其正态拟合效果图;表八是其直线回归方程拟合效果图;表九是绘制的母血TSH水平与脐带血TSH水平两个变量之间的散点图。
从中可以看出两者之间的关系较为明显,且存在一定的线性关系。
实验报告六判别分析(连续型)
一、问题:
随机抽样测量得20例正常人(组1)、30例过敏性紫癜患者(组2)、20例系统性红斑狼疮患者(组3)的免疫球蛋白A、M、G三个指标的观测值见下表。
通过这些资料建立判别准则,根据免疫球蛋白的观测值进行疾病诊断。
二、数据:
组别
IgA
IgM
IgG
1
37.14
60.22
266.17
1
33.57
86.85
296.03
1
30.12
57.10
327.13
1
26.83
76.54
319.23
1
2.64
60.22
296.03
1
31.86
73.17
296.03
1
30.12
90.36
335.07
1
33.57
60.22
303.68
1
26.02
90.36
223.61
1
26.02
60.22
280.96
1
24.44
73.17
266.17
1
26.02
69.89
288.47
1
32.69
54.01
288.47
1
26.02
47.99
327.13
1
13.73
36.43
288.47
1
28.46
73.17
244.53
1
22.15
90.36
230.51
1
30.12
60.22
303.68
1
30.12
79.92
280.96
1
28.46
76.54
251.66
2
7.15
136.05
608.46
2
10.01
39.24
288.47
2
16.40
66.60
311.44
2
7.71
178.93
608.43
2
13.73
108.61
418.71
2
22.90
97.55
472.49
2
9.42
161.27
671.20
2
28.46
47.99
335.07
2
7.71
170.01
472.49
2
8.84
76.54
436.35
2
9.42
251.48
568.06
2
25.23
101.20
436.35
2
26.02
124.05
427.50
2
8.27
86.85
375.96
2
30.12
83.34
427.50
2
28.46
108.61
327.13
2
20.66
231.17
538.61
2
5.02
77.56
558.17
2
19.96
80.75
463.36
2
15.72
132.01
899.72
2
14.38
121.58
500.40
2
21.39
144.27
427.50
2
4.52
47.99
418.71
2
13.73
116.24
410.00
2
5.02
328.04
781.70.
2
41.82
97.55
367.64
2
10.61
188.04
418.71
2
21.39
231.17
703.58
2
45.72
124.05
335.07
2
2.56
73.17
335.07
3
10.01
36.43
266.17
3
10.01
86.85
319.23
3
17.78
30.91
327.13
3
17.08
30.91
244.53
3
8.27
36.43
233.61
3
12.46
28.34
367.64
3
16.40
28.34
300.68
3
15.05
100.58
392.84
3
22.15
42.11
258.89
3
18.49
39.24
343.10
3
8.27
44.61
335.07
3
26.02
47.46
343.10
3
5.02
36.34
351.19
3
7.15
57.10
251.66
3
11.83
76.54
445.29
3
29.29
63.39
244.53
3
24.44
60.22
294.03
3
34.45
124.05
280.96
3
15.72
69.89
355.07
3
16.40
66.22
311.44
三、统计处理:
本实验属于连续型变量的判别分析,涉及三个类别四个指标,采用SPSS中”Analyze”菜单下”Classify”的”Discriminant”实现数据的处理分析。
四、结果及分析:
1.相关分析结果
表一:
表二:
表三:
表四:
表五:
表六:
2、结论:
表一是三种类别下三个指标的均值、标准差值等数据表,表二是各个变量之间的区分能力,三个指标的P值均小于0.05,这表明在0.05水平下,各指标的区分能力好。
表三为合并的协方差和相关系数值表,表四是协方差齐性检验,P<0.05,说明协方差具有齐性,可以进行下一步分析。
表五是默认的先验概率值表,其默认先验概率为0.33。
从表六看,我们可以分别写出三种患者类别的Fisher判别函数,见下:
正常人、过敏性紫癜患者、系统性红斑狼疮患者线性判别函数: