基于聚类回归和因子分析的国家经济发展对生态环境的影响研究.docx
《基于聚类回归和因子分析的国家经济发展对生态环境的影响研究.docx》由会员分享,可在线阅读,更多相关《基于聚类回归和因子分析的国家经济发展对生态环境的影响研究.docx(33页珍藏版)》请在冰点文库上搜索。
基于聚类回归和因子分析的国家经济发展对生态环境的影响研究
山东科技大学
经济管理学院硕士研究生课程论文
(注:
平时作业)
基于聚类、回归和因子分析的国家经济发展对
生态环境的影响研究
课程名称统计分析及其软件应用
班级硕研2014级
学生姓名
学号140720035
基于聚类、回归和因子分析的国家经济发展对
生态环境的影响研究
摘要:
近年来,我国的经济得到快速的发展,在经济发展的同时,另一个严峻的问题逐渐显现出来,就是生态环境的破坏。
通过对国内经济和生态环境的现状分析,利用SPSS软件探究基于聚类、回归和因子分析的国家经济发展对生态环境的影响,然后提出相应的对策。
关键字:
经济发展生态环境影响对策
Abstract:
Inrecentyears,withtherapiddevelopmentofourcountry'seconomy,anotherseriousproblemthatthedestructionoftheecologicalenvironmenthasgraduallyrevealed.Throughtheanalysisofpresentsituationofbothdomesticeconomyandecologicalenvironment,exploretheimpactwhicheconomicdevelopmenthaveontheecologicalenvironmentbySPSS,andthenputsforwardcorrespondingcountermeasures.
KeyWords:
Economicdevelopment;Ecologicalenvironment;Impact;Countermeasures
一绪论
近年来,我国经济发展迅速,成为世界上最大的发展中国家,伴随着经济的发展,另一严峻的问题逐渐显现出来,就是生态环境的破坏。
经济的发展离不开资源,大量开采和挖掘生态资源,对生态环境构成了严重的威胁,人类为了经济发展对大自然的肆意破坏,相应地,自然正在向我们传递着经济的发展受到威胁的信号。
近年来,泥石流、洪水灾害、土地沙漠化的发生率越来越高,生物多样性逐渐减少,大气污染造成的酸雨等等给经济的发展和人类的生存带来了无法挽回的灾难。
因此,保护生态环境,协调治理生态环境和经济发展之间的关系刻不容缓,是国家亟待解决的问题。
通过对国内经济和生态环境的现状分析,利用SPSS软件探究经济发展对生态环境的影响,然后提出相应的对策。
二国内经济的发展现状
近年来,我国经济发展迅速,成为世界上最大的发展中国家,随着国家经济的快速发展,国内生产总值在逐年增加,表2-1和图2-1显示的是2000年到2013年的国内生产总值。
表2-1国内生产总值
指标
国内生产总值
地区
全国
频度
年
单位
亿元
2000
99214.55
2001
109655.17
2002
120332.69
2003
135822.76
2004
159878.34
2005
184937.37
2006
216314.43
2007
265810.31
2008
314045.43
2009
340902.81
2010
401512.8
2011
473104.05
2012
519470.1
2013
568845.21
图2-1国内生产总值
从图表中可以看出GDP呈现上升的趋势,但是,每个省的GDP是不同的,通过聚类分析研究各省GDP的情况,下面是聚类分析的结果。
(一)案例处理汇总表和近似矩阵表
案例处理汇总表介绍了参加聚类的案例个数和百分比等信息,接下来是各样本之间的距离矩阵,可以作为样本之间距离的一个参考依据。
(二)聚类状态表
聚类状态表能直观显示聚类分析过程中各阶段所聚合的变量。
第一列显示了聚类过程中的步骤数,第二列和第三列显示的是对应的步骤中哪些变量进行了合并,第四列显示被合并的两变量之间的距离,第五列和第六列显示的是参与聚类的是样本还是小类。
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
群集1
群集2
1
7
13
36690.372
0
0
6
2
10
11
104259.768
0
0
11
3
21
22
825622.735
0
0
4
4
14
21
2458619.308
0
3
9
5
17
23
2593281.994
0
0
8
6
7
19
6323453.358
1
0
10
7
3
16
6938148.802
0
0
11
8
17
20
9749911.079
5
0
16
9
14
18
11849640.602
4
0
16
10
7
15
21374395.250
6
0
19
11
3
10
23628953.215
7
2
12
12
3
4
38914907.486
11
0
15
13
2
9
46182666.309
0
0
18
14
5
8
55864056.579
0
0
17
15
1
3
92464061.738
0
12
18
16
14
17
98032688.569
9
8
19
17
5
12
1.974E8
14
0
22
18
1
2
2.167E8
15
13
20
19
7
14
3.634E8
10
16
21
20
1
6
6.749E8
18
0
21
21
1
7
1.553E9
20
19
22
22
1
5
7.270E9
21
17
0
图2-2聚类状态表
(三)聚类成员表
聚类成员设定的最小聚类数是2,最大聚类数是4,如图2-3,该表可以结合后面的树状图进行分析,确定合理的类别数和成员归属。
群集成员
案例
4群集
3群集
2群集
1:
北京市
1
1
1
2:
天津市
1
1
1
3:
河北省
2
2
1
4:
山西省
1
1
1
5:
内蒙古自
1
1
1
6:
辽宁省
1
1
1
7:
吉林省
1
1
1
8:
黑龙江省
1
1
1
9:
上海市
1
1
1
10:
江苏省
3
3
2
11:
浙江省
2
2
1
12:
安徽省
1
1
1
13:
福建省
1
1
1
14:
江西省
1
1
1
15:
山东省
3
3
2
16:
河南省
2
2
1
17:
湖北省
1
1
1
18:
湖南省
1
1
1
19:
广东省
3
3
2
20:
广西壮族
1
1
1
21:
海南省
4
1
1
22:
重庆市
1
1
1
23:
四川省
1
1
1
24:
贵州省
4
1
1
25:
云南省
1
1
1
26:
西藏自治
4
1
1
27:
陕西省
1
1
1
28:
甘肃省
4
1
1
29:
青海省
4
1
1
30:
宁夏回族
4
1
1
31:
新疆维吾
4
1
1
图2-3不同分类下群集成员表
(四)垂直冰柱图
如图2-4,可以水平划一条横线,首先可以看出广东、山东和江苏聚为1类,其次是浙江、河南和河北实现了第2步聚类,然后是甘肃、新疆维吾尔、贵州、西藏自治、宁夏回族、青海和海南实现第3步聚类,然后依次类推。
图2-4冰柱图
(五)树状图
图2-5非常直观地反应出聚类过程及样本简单的层次关系,从图中可以发现,样本聚为四类是比较合适的,一类是山东、江苏和广东,这些省市的地理位置好,属于经济发达的地区;一类是甘肃、新疆维吾尔、贵州、西藏自治、宁夏回族、青海和海南,这些省市地理位置偏僻,经济发展较落后;一类是浙江、河南和河北;剩下的省市是一类。
图2-5树状图
三中国生态环境现状
给据《中国脆弱生态环境类型分布及其综合整治》[1],对全国的生态环境的脆弱程度进行了分析,如表3-1所示。
表3-1全国生态环境脆弱度
极度脆弱
强度脆弱
中度脆弱
轻度脆弱
宁夏
0.8353
四川
0.6285
辽宁
0.4400
山东
0.2575
西藏
0.8329
河北
0.6204
黑龙江
0.4340
广东
0.1647
青海
0.8045
内蒙
0.6186
江西
0.4137
浙江
0.2017
甘肃
0.7821
云南
0.5925
湖南
0.3418
贵州
0.7153
河南
0.5893
福建
0.3123
山西
0.6927
吉林
0.5248
陕西
0.6613
湖北
0.4766
新疆
0.6537
广西
0.4507
表中数据显示,生态环境极度脆弱的地区主要集中在西部地区,强度脆弱主要分布在国家的中部地区,中度和轻度脆弱的地区重要集中在沿海地区。
下文将从水资源、能源和自然灾害等方面分析中国生态环境的破坏问题以及对经济发展产生的影响。
四经济发展对生态环境的有利影响
表4-1描述了国内生产总值和环境污染治理投资总额。
从图表中可以看出GDP呈现不断上升的趋势,环境治理投资总额也在不断增加。
表4-1GDP和环境污染治理投资总额
年份
GDP
环境污染治理投资总额
2000
99214.55
1014.9
2001
109655.17
1106.6
2002
120332.69
1367.2
2003
135822.76
1627.7
2004
159878.34
1909.8
2005
184937.37
2388
2006
216314.43
2566
2007
265810.31
3387.3
2008
314045.43
4937.03
2009
340902.81
5258.39
2010
401512.8
7612.19
2011
473104.05
7114.03
2012
519470.1
8253.46
2013
568845.21
9516.5
接下来对GDP和环境污染治理投资总额进行相关分析和回归分析。
(一)相关分析
1..绘制散点图
图4-1GDP和环境污染治理投资总额的散点图
从散点图看出,GDP和环境污染治理投资总额存在线性相关关系,可以继续进行相关分析。
2.Pearson积差相关分析
图4-2是对GDP和环境污染治理投资总额,进行Pearson积差相关分析的结果,表中“.989”表示GDP和环境污染治理投资总额的相关系数是.989,其上方的“**”表明两者在0.01水平上达到显著相关。
双侧检验的显著性概率(Sig)为0.000,小于0.01,同样说明GDP和环境污染治理投资总额不想关的概率小于0.01。
结果表明GDP越高,环境污染治理投资总额就越高。
相关性
GDP
环境污染治理投资总额
GDP
Pearson相关性
1
.989**
显著性(双侧)
.000
N
14
14
环境污染治理投资总额
Pearson相关性
.989**
1
显著性(双侧)
.000
N
14
14
**.在.01水平(双侧)上显著相关。
图4-2GDP和环境污染治理投资总额的Pearson积差相关分析
(二)回归分析
1.输入和移去的变量
在这个模型中,只有一个输入的变量“GDP”,如图4-3所示,没有删除的变量,使用的方法是“输入”。
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
GDPa
.
输入
a.已输入所有请求的变量。
b.因变量:
环境污染治理投资总额
图4-3输入/移去的变量
2.模型汇总
如图4-4所示为回归模型的汇总表,每个模型包括相关系数R、相关系数的平方R方、调整后的相关系数和估计的标准误差。
图中看出GDP和环境污染治理投资总额的相关系数为0.989,调整后的R方式0.976,说明回归方程的代表性强。
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.989a
.978
.976
452.98412
a.预测变量:
(常量),GDP。
b.因变量:
环境污染治理投资总额
图4-4模型汇总
3.方差分析
图4-5为回归模型的方程分析摘要表,变异量显著性检验的F值为537.083,显著性检验的p值为0.000,小于0.01的显著水平,说明回归系数不等于0,GDP和环境污染治理投资总额有线性回归关系,可以建立回归方程。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
1.102E8
1
1.102E8
537.083
.000a
残差
2462335.340
12
205194.612
总计
1.127E8
13
a.预测变量:
(常量),GDP。
b.因变量:
环境污染治理投资总额
图4-5方差分析
4.回归系数
图4-6为回归模型的回归系数和回归系数的显著性检验,包括未标准化的回归系数、标准化的回归系数、回归系数的显著性检验的t值。
显著性水平p值为0.000,小于0.01的显著水平,拒绝回归系数等于0的原假设,回归方程有意义。
从图中可以得到标准化的回归方程是:
环境污染治理投资总额=-930.467+0.018GDP。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-930.467
250.319
-3.717
.003
GDP
.018
.001
.989
23.175
.000
a.因变量:
环境污染治理投资总额
图4-6系数
5.残差统计量
图4-7为残差统计量,包括“预测值”、“残差”、“标准化预测值”和“标准化残差”的描述性统计量,“预测值”的极小值是873.371,极大值是9411.813,均值是4147.078,标准偏差为2911.600。
本例选取的样本量较少,实际研究应该选取多一点的样本为好,会让回归方程更加稳定有效。
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
873.3712
9411.8135
4147.0786
2911.60074
14
残差
-557.09576
1242.67810
.00000
435.21306
14
标准预测值
-1.124
1.808
.000
1.000
14
标准残差
-1.230
2.743
.000
.961
14
a.因变量:
环境污染治理投资总额
图4-7残差统计量
通过分析可知,GDP和环境污染治理投资总额具有很强的线性关系,并且是正相关。
GDP的增加,环境污染治理投资总额也会增加。
换言之,国家经济的发展会提高生态治理的能力,为更好的保护环境提供了资金支持。
五经济发展对生态环境的不利影响
表5-1显示了GDP和用水总量、能源消费总量和废水排放总量,接下来通过SPSS软件分析GDP和三者之间的关系。
因为前面已经详细介绍了模型的内容,所以下面只选择重点的部分进行讲解。
表5-1GDP和用水总量、能源消费总量和废水排放总量
指标
用水总量
废水排放总量
能源消费总量(标准量)
国内生产总值
地区
全国
全国
全国
全国
频度
年
年
年
年
单位
亿立方米
万吨
万吨标煤
亿元
2001
5567.43
150406
109655.17
2002
5497.28
159431
120332.69
2003
5320.4
183792
135822.76
2004
5547.8
213456
159878.34
2005
5632.98
235996.65
184937.37
2006
5794.97
258676
216314.43
2007
5818.67
280508
265810.31
2008
5909.95
291448.3
314045.43
2009
5965.15
306647.15
340902.81
2010
6021.99
324939.15
401512.8
2011
6107.2
6591922.44
348001.65
473104.05
2012
6141.8
6847612.14
361732.01
519470.1
2013
6183.45
6954432.7
375000
568845.21
(一)对水资源的影响
1.对用水总量的分析
(1)散点图分析
图5-1GDP和用水总量的散点图
从散点图看出,GDP和用水总量存在线性相关关系,可以继续进行相关分析。
(2)Pearson积差相关分析
图5-2是对GDP和用水总量,进行Pearson积差相关分析的结果,表中“.947”表示GDP和用水总量的相关系数是.947,其上方的“**”表明两者在0.01水平上达到显著相关。
双侧检验的显著性概率(Sig)为0.000,小于0.01,同样说明GDP和用水总量不想关的概率小于0.01。
结果表明GDP越高,用水总量就越高。
相关性
GDP
用水总量
GDP
Pearson相关性
1
.947**
显著性(双侧)
.000
N
13
13
用水总量
Pearson相关性
.947**
1
显著性(双侧)
.000
N
13
13
**.在.01水平(双侧)上显著相关。
图5-2GDP和用水总量的Pearson积差相关分析
(3)回归分析
图5-3为回归模型的方程分析摘要表,变异量显著性检验的F值为95.910,显著性检验的p值为0.000,小于0.01的显著水平,说明回归系数不等于0,GDP和用水总量有线性回归关系,可以建立回归方程。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
819580.833
1
819580.833
95.910
.000a
残差
93998.891
11
8545.354
总计
913579.724
12
a.预测变量:
(常量),GDP。
b.因变量:
用水总量
图5-3方差分析
图5-4为回归模型的回归系数和回归系数的显著性检验,包括未标准化的回归系数、标准化的回归系数、回归系数的显著性检验的t值。
显著性水平p值为0.000,小于0.01的显著水平,拒绝回归系数等于0的原假设,回归方程有意义。
从图中可以得到标准化的回归方程是:
用水总量=5322.655+0.002GDP。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
5322.665
55.832
95.333
.000
GDP
.002
.000
.947
9.793
.000
a.因变量:
用水总量
图5-4系数
2.对废水排放总量的影响
(1)散点图分析
图5-5GDP和废水排放总量的散点图
从散点图看出,GDP和废水排放总量存在线性相关关系,可以继续进行相关分析。
(2)Pearson积差相关分析
图5-6是对GDP和废水排放总量,进行Pearson积差相关分析的结果,表中“.969”表示GDP和废水排放总量的相关系数是.969。
双侧检验的显著性概率(Sig)为0.000,小于0.01,同样说明GDP和废水排放总量不想关的概率小于0.01。
结果表明GDP越高,废水排放总量就越高。
相关性
GDP
废水排放总量
GDP
Pearson相关性
1
.969
显著性(双侧)
.160
N
13
3
废水排放总量
Pearson相关性
.969
1
显著性(双侧)
.160
N
3
3
图5-6GDP和废水排放总量的Pearson积差相关分析
3.对水资源污染情况的分析
根据2011年到2013年全国废水中的主要污染物的数据,通过因子分析探讨对环境造成污染的企业类型,因子分析的结果如下。
(1)相关矩阵表
图5-7是各变量的相关矩阵表,从表中可以看出,矩阵中的相关系数都大于0.3,说明变量之间有较强的相关关系,适合做因子分析。
相关矩阵a
化学需氧量
氨氮
总氮
总磷
石油类
挥发酚
铅
汞
镉
六价铬
总铬
砷
相关
化学需氧量
1.000
.998
-.247
.885
.732
.949
.977
.938
1.000
.967
.954
1.000
氨氮
.998
1.000
-.186
.855
.688
.928
.962
.915
.999
.950
.933
.997
总氮
-.247
-.186
1.000
-.669
-.841
-.539
-.447
-.567
-.222
-.485
-.527
-.258
总磷
.885
.855
-.669
1.000
.965
.987
.964
.992
.873
.974
.984
.890
石油类
.732
.688
-.841
.965
1.000
.909
.860
.923
.714
.881
.903
.739
挥发酚
.949
.928
-.539
.987
.909
1.000
.994
.999
.941
.998
1.000
.953
铅
.977
.962
-.447
.964
.860
.994
1.000
.990
.972
.999
.996
.980
汞
.938
.915
-.567
.992
.923
.999
.990
1.000
.929
.995
.999
.942
镉
1.0