实习报告 计算机地质 实习报告.docx
《实习报告 计算机地质 实习报告.docx》由会员分享,可在线阅读,更多相关《实习报告 计算机地质 实习报告.docx(19页珍藏版)》请在冰点文库上搜索。
实习报告计算机地质实习报告
《计算机地质学》
回归分析与数据预处理
上机实习报告
实验一回归分析上机实习
一、实验目的
1.了解回归分析基本原理,加深对课本内容理解记忆;
2.熟悉回归分析解题步骤,掌握上机软件应用;
3.能对回归分析的结果做出科学合理解释,能将本节知识与地质工程研究问题有效结合,做到“学以致用”。
二、实验内容
1.建立原始数据文件,通过回归分析得到结果数据,进行相应的地质解释;
2.初步掌握一元及多元回归分析的解题步骤。
三、实验步骤
1.打开地学信息系统。
2.文件操作——新建原始数据文件——输入原始数据(按照格式)。
3.文件操作——保存原始数据文件(注意文件名和文件保存地点)
4.属性分析——回归分析(一元线性回归、多元线性回归、逐步回归)
5.“开始计算吗?
”——确定
6.请输入F检验值(若进行线性回归FA=0)FA=?
……如果FA<>0,则进行逐步回归分析。
7.是否输出变换矩阵?
……每一步的相关系数矩阵。
8.到此为止,结果全部出来。
9.“结束回归分析(Y/N)?
”
10.抄录结果
11.文件操作——保存计算结果(注意提供文件名和文件保存地点)
四、实验结果
1.一元回归分析实例
算例一:
从某煤矿采集11个煤样,分别测定煤的发热量(
)和煤灰分(
)含量,获得如下表数据:
样品号
1
2
3
4
5
6
7
8
9
10
11
(千卡)
8.30
7.8
7.7
7.2
6.8
6.2
5.6
5.5
5.00
4.70
4.3
0.03
0.05
0.08
0.10
0.15
0.20
0.27
0.30
0.34
0.40
0.45
试建立煤的发热量(
)对煤灰分(
)的回归方程,并检验该回归方程的显著性。
(1)原始数据文件
11,1
1,8.30,0.03
2,7.8,0.05
3,7.7,0.08
4,7.2,0.10
5,6.8,0.15
6,6.2,0.20,
7,5.6,0.27
8,5.5,0.30
9,5.00,0.34
10,4.70,0.40
11,4.3,0.45
(2)结果数据文件
线性回归或逐步回归计算:
K=1
矩阵变换
(1)
1.0000.505
-0.5050.745
回归方程:
Y=-5.068602+.9153329X
(1)
复相关系数=.505001563268074
标准差=.786051878750591
F-检验值=3.080968
拟合表:
序号实测值回归值偏差值
10.0302.529-2.499
20.0502.071-2.021
30.0801.979-1.899
40.1001.522-1.422
50.1501.156-1.006
60.2000.606-0.406
75.6001.3394.261
85.5002.2543.246
95.0003.1691.831
104.7004.0850.615
114.3005.000-0.700
(3)对结果数据进行解释
该实例中涉及一个自变量,一个因变量,属于一般的一元回归分析。
通过实验数据,我们观察偏差值,发现回归值与实测值相差较大,该数据的回归方程不可用。
结合题目,煤的发热量(
)和煤灰分(
)在本次试验中,无法得到其相关变化关系。
算例二:
煤矿脉中13个相邻样本点处某种伴生金属的含量数据如下表:
样品号
1
2
3
4
5
6
7
距离x
2
3
4
5
7
8
10
含量y
106.42
108.20
109.58
109.50
110.00
109.93
110.49
样品号
8
9
10
11
12
13
距离x
11
14
15
16
18
19
含量y
110.59
110.60
110.90
110.76
111.00
111.20
试建立y对x的回归方程,并进行显著性检验。
(1)原始数据文件
13,1
1,2,106.42
2,3,108.20
3,4,109.58
4,5,109.50
5,7,110.00
6,8,109.93
7,10,110.49
8,11,110.59
9,14,110.60
10,15,110.90
11,16,110.76
12,18,111.00
13,19,111.20
(2)结果数据文件
线性回归或逐步回归计算:
回归方程:
Y=108.0184+.1888678X
(1)
复相关系数=.83006340462591
标准差=.233485265087972
F-检验值=24.37037
拟合表:
序号实测值回归值偏差值
1106.420108.396-1.976
2108.200108.585-0.385
3109.580108.7740.806
4109.500108.9630.537
5110.000109.3410.660
6109.930109.5290.401
7110.490109.9070.583
8110.590110.0960.494
9110.600110.663-0.063
10110.900110.8510.049
11110.760111.040-0.280
12111.000111.418-0.418
13111.200111.607-0.407
(3)对结果数据进行解释
就本题而言,题目中涉及自变量距离x及因变量含量y,隶属于一元回归分析。
通过观察比对实验结果,偏差值较小,即回归值与实测值较为接近,即知道该题目回归方程可用。
结合题目所对应实际问题,即煤矿脉中13个相邻样本点处某种伴生金属的含量数据满足次方程:
Y=108.0184+.1888678X
(1)。
2.多元回归分析实例
算例一:
某矿区从18个矿样中测得Cu,Pd,Pt的含量如下所示,试求Pt对Cu和Pd的回归方程,并检验其有无实用价值。
编号
Cu(%)
Pd(g/t)
Pt(g/t)
编号
Cu(%)
Pd(g/t)
Pt(g/t)
1
0.36
0.169
0.176
10
0.06
0.023
0.045
2
0.05
0.035
0.020
11
0.53
0.329
0.292
3
0.24
0.248
0.262
12
0.06
0.065
0.080
4
0.05
0.015
0.035
13
0.21
0.283
0.235
5
0.22
0.216
0.234
14
0.03
0.030
0.030
6
0.13
0.086
0.092
15
0.33
0.21
0.237
7
0.10
1.300
1.669
16
0.01
0.030
0.050
8
0.07
0.009
0.006
17
0.21
0.252
0.24
9
0.16
0.160
0.150
18
0.08
0.053
0.103
(1)原始数据文件
18,2
1,0.36,0.169,0.176
2,0.05,0.035,0.020
3,0.24,0.248,0.262
4,0.05,0.015,0.035
5,0.22,0.216,0.234
6,0.13,0.086,0.092
7,0.10,1.300,1.669
8,0.07,0.009,0.006
9,0.16,0.160,0.150
10,0.06,0.023,0.045
11,0.53,0.329,0.292
12,0.06,0.065,0.080
13,0.21,0.283,0.235
14,0.03,0.030,0.030
15,0.33,0.21,0.237
16,0.01,0.030,0.050
17,0.21,0.252,0.24
18,0.08,0.053,0.103
(2)结果数据文件
线性回归或逐步回归计算:
回归方程:
Y=1.017146E-02+-.2513926X
(1)+1.281512X
(2)
复相关系数=.996513855923107
标准差=8.58003510201306E-03
F-检验值=1070.065
拟合表:
序号实测值回归值偏差值
10.1760.1360.040
20.0200.042-0.022
30.2620.268-0.006
40.0350.0170.018
50.2340.2320.002
60.0920.0880.004
71.6691.6510.018
80.0060.0040.002
90.1500.175-0.025
100.0450.0250.020
110.2920.299-0.007
120.0800.0780.002
130.2350.320-0.085
140.0300.041-0.011
150.2370.1960.041
160.0500.0460.004
170.2400.280-0.040
180.1030.0580.045
(3)对结果数据进行解释
该题目中涉及自变量
,
,
三个量,故该题目属于多元回归分析。
通过偏差值观测,我们发现回归值接近实测值。
该矿区从18个矿样中测得Cu,Pd,Pt的含量数据,求得Pt对Cu和Pd的回归方程为:
Y=1.017146E-02+-.2513926X
(1)+1.281512X
(2)。
该结果可行,有实用价值。
算例二:
由于碳、氢、氧是煤燃烧过程中产生热量的主要元素,对某矿(褐煤、常烟煤、肥煤、焦煤和无烟煤)中取12块煤样,经分析化验后,其发热量
(焦耳/克)与Cr(%)、Hr(%)、Or(%)元素的数据如下。
问:
今后能否不再对该矿煤进行发热量测定,而由元素分析结果对其进行预测?
编号
Cr(%)
Hr(%)
Or(%)
(J/g)
编号
Cr(%)
Hr(%)
Or(%)
(J/g)
1
62
5.0
15
6.5
7
85
6.0
6.0
8.4
2
70
6.0
20
7.0
8
88
3.0
3.0
8.5
3
75
6.5
25
7.2
9
90
5.0
5.0
8.8
4
75
5.0
10
7.5
10
90
2.5
2.5
8.0
5
78
5.5
15
7.7
11
92
3.0
3.0
8.5
6
80
5.2
4.0
8.0
12
95
3.5
3.5
8.7
(1)原始数据文件
12,3
1,62,5.0,15,6.5
2,70,6.0,20,7.0
3,75,6.5,25,7.2
4,75,5.0,10,7.5
5,78,5.5,15,7.7
6,80,5.2,4.0,8.0
7,85,6.0,6.0,8.4
8,88,3.0,3.0,8.5
9,90,5.0,5.0,8.8
10,90,2.5,2.5,8.0
11,92,3.0,3.0,8.5
12,95,3.5,3.5,8.7
(2)结果数据文件
线性回归或逐步回归计算:
回归方程:
Y=2.061131+6.473414E-02X
(1)+.1895936X
(2)+-3.596589E-02X(3)
复相关系数=.982831427827036
标准差=5.60203795438529E-02
F-检验值=75.66705
拟合表:
序号实测值回归值偏差值
16.5006.4830.017
27.0007.011-0.011
37.2007.249-0.049
47.5007.505-0.005
57.7007.6140.086
68.0008.082-0.082
78.4008.485-0.085
88.5008.2190.281
98.8008.6550.145
108.0008.271-0.271
118.5008.4780.022
128.7008.749-0.049
(3)对结果数据进行解释
该题目主要研究发热量
(焦耳/克)与Cr(%)、Hr(%)、Or(%)元素的数据关系,题目中涉及三个自变量,属于多元回归分析。
经实验得到如上数据,分析知实验值与回归值接近,故得出如下结论:
发热量
(焦耳/克)与Cr(%)、Hr(%)、Or(%)元素满足如下关系
Y=2.061131+6.473414E-02X
(1)+.1895936X
(2)+-3.596589E-02X(3)。
该矿煤进行发热量测定是有其科学性的,是可行的。
实验二预处理与统计
一、实验目的
通过完成数据统计和预处理程序的设计和实现及完成算例,掌握统计一组数据的极值、均值、方差、变异系数及进行数据预处理的方法。
二、实验内容
对数据文件进行管理,包括原始数据建立,抽取行列构成新文件,异常值的鉴别与剔除。
三、实验步骤
1.打开地学信息系统。
2.文件操作——新建原始数据文件——输入原始数据(按照格式)。
3.文件操作——保存原始数据文件(注意文件名和文件保存地点)
4.预处理与统计——数据管理
5.“开始计算吗?
”——确定
6.请输入F检验值(若进行线性回归FA=0)FA=?
……如果FA<>0,则进行逐步回归分析。
7.是否输出变换矩阵?
……每一步的相关系数矩阵。
8.鉴别剔除异常值(Y/N)?
8.到此为止,结果全部出来。
9.“结束回归分析(Y/N)?
”
10.抄录结果
11.文件操作——保存计算结果
四、实验结果
算例:
请对以下15个样品数据进行数据统计和数据预处理
样品
变量
1
2
3
4
5
6
7
8
9
1
1.766115
3.481379
52.62
5.70
15.27
9.95
5.82
9.60
1158
2
1.728760
3.234192
52.52
2.20
38.92
2.40
1.04
1.40
1578
3
1.715418
3.682390
61.10
5.20
23.35
2.78
2.86
1.36
1372
4
1.459392
3.982461
30.36
33.59
28.21
3.09
0.89
1.58
1383
5
1.738305
3.505710
71.90
4.00
14.59
2.33
1.04
1.55
1285
6
1.713323
3.293934
53.58
1.80
37.84
3.23
1.09
1.80
1564
7
1.751741
3.482815
66.16
4.00
18.59
4.46
1.38
1.61
1320
8
1.853637
3.461214
64.26
5.90
14.27
5.56
2.27
3.98
1230
9
1.649627
3.773592
55.80
7.80
23.89
4.19
3.11
2.23
1350
10
1.720903
3.392639
51.70
2.60
37.19
3.36
2.44
1.00
1549
11
1.737908
3.471311
59.20
3.70
30.48
2.75
1.18
0.94
1479
12
1.631849
3.824918
56.12
10.50
17.3
8.37
2.07
4.90
1233
13
1.720407
3.292416
56.06
4.60
36.00
1.17
1.23
0.31
1555
14
1.828789
3.497142
72.88
6.05
14.49
3.09
1.04
1.28
1290
15
1.709948
3.675595
67.90
5.40
15.84
4.39
2.96
2.19
1282
(1)原始数据文件
15,9
1,1.766115,3.481379,52.62,5.70,15.27,9.95,5.82,9.60,1158
2,1.728760,3.234192,52.52,2.20,38.92,2.40,1.04,1.40,1578
3,1.715418,3.682390,61.10,5.20,23.35,2.78,2.86,1.36,1372
4,1.459392,3.982461,30.36,33.59,28.21,3.09,0.89,1.58,1383
5,1.738305,3.505710,71.90,4.00,14.59,2.33,1.04,1.55,1285
6,1.713323,3.293934,53.58,1.80,37.84,3.23,1.09,1.80,1564
7,1.751741,3.482815,66.16,4.00,18.59,4.46,1.38,1.61,1320
8,1.853637,3.461214,64.26,5.90,14.27,5.56,2.27,3.98,1230
9,1.649627,3.773592,55.80,7.80,23.89,4.19,3.11,2.23,1350
10,1.720903,3.392639,51.70,2.60,37.19,3.36,2.44,1.00,1549
11,1.737908,3.471311,59.20,3.70,30.48,2.75,1.18,0.94,1479
12,1.631849,3.824918,56.12,10.50,17.3,8.37,2.07,4.90,1233
13,1.720407,3.292416,56.06,4.60,36.00,1.17,1.23,0.31,1555
14,1.828789,3.497142,72.88,6.05,14.49,3.09,1.04,1.28,1290
15,1.709948,3.675595,67.90,5.40,15.84,4.39,2.96,2.19,1282
(2)结果数据文件
鉴别并剔除异常值:
计算均值和标准差:
AX
(1)=1.715075S
(1)=9.024319E-02
AX
(2)=3.53678S
(2)=.2117575
AX(3)=58.144S(3)=10.43159
AX(4)=6.869333S(4)=7.715266
AX(5)=24.41533S(5)=9.562974
AX(6)=4.074667S(6)=2.334777
AX(7)=2.028S(7)=1.315296
AX(8)=2.382S(8)=2.311914
AX(9)=1375.2S(9)=137.9431
使第1列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第3列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第5列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第7列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第2列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第4列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第6列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第8列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
使第9列元素升序排列:
据4-SIGMA准则
数据左端无异常值!
数据右端无异常值!
-1-
最大值:
1.854
最小值:
1.459
极差:
.394
算术平均值:
1.715
标准差:
.09
变异系数:
.053
-4-
最大值:
33.59
最小值:
1.8
极差:
31.79
算术平均值:
6.869
标准差:
7.715
变异系数:
1.123
-7-
最大值:
5.82
最小值:
.89
极差:
4.93
算术平均值:
2.028
标准差:
1.315
变异系数:
.649
-2-
最大值:
3.982
最小值:
3.234
极差:
.748
算术平均值:
3.537
标准差:
.212
变异系数:
.06
-5-
最大值:
38.92
最小值:
14.27
极差:
24.65
算术平均值:
24.415
标准差:
9.563
变异系数:
.392
-8-
最大值:
9.6
最小值:
.31
极差:
9.29
算术平均值:
2.382
标准差:
2.312
变异系数:
.971
-3-
最大值:
72.88
最小值:
30.36
极差:
42.52
算术平均值:
58.144
标