长沙空气质量统计分析.docx
《长沙空气质量统计分析.docx》由会员分享,可在线阅读,更多相关《长沙空气质量统计分析.docx(11页珍藏版)》请在冰点文库上搜索。
HUNAN
UNIVERSITY
统计学论文
论文题目 长沙PM2.5情况以及影响因素探究
学生 易鑫
学号 201318210224
专业班级 金融工程1301
学院名称 金融与统计学院
目录
摘要 3
一、PM2.5定义以及长沙地区PM2.5的计算及评价方法 4
二、影响长沙PM2.5的因素简述 5
三、影响长沙PM2.5的因素相关分析与显著性检验 5
(1)五项指标与PM2.5间的相关分析 6
(2)PM2.5与其他五项指标相关性的显著性检验 9
(3)PM2.5与其他指标的偏相关系数分析 10
四、结论 10
参考文献 11
摘要
身边总是有非长沙本地的同学和朋友,特别是来自沿海地区的同学抱怨长沙的空气质量,说长沙这个Pm2.5天天爆表的地方会污染他们的肺。
因此本人想用统计学的方法,求证下面两个问题:
1、长沙的空气真的就如所说的那样
“不堪呼吸”吗?
2、影响长沙空气PM2.5指数的又有哪些因素呢?
之后形成本篇论文的结论。
关键词:
长沙PM2.5指数,相关分析,显著性分析,偏相关分析
3
一、PM2.5定义以及长沙地区PM2.5的计算及评价方法
首先我们先来解读一下PM2.5的定义,PM2.5就是指空气中的细颗粒物,又称细粒、细颗粒,主要因为其在环境空气中空气动力学当量直径小于等于
2.5微米而得名。
它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。
虽然PM2.5只是地球大气成分中含量很少的组分,但它对空气质量和能见度等有重要的影响。
那么长沙的PM2.5的数据又是如何统计出来的呢?
目前来看,长沙PM2.5共有十个点,分别是:
经开区、马坡岭、天心区、伍家岭、沙坪、湖师大、高开、火车新站、雨花区、湖南中医院十个监测点,那么,可以发现,10个监测点的地理位置分布,是具有一定代表性的环境。
包括情节对照点,即空气质量好,远离污染源的地方,也包括人流量大,靠近闹市区的地方。
各监测点分布情况为:
芙蓉区2个,开福区及岳麓区2个,高开区、经开区、天心区和雨花区各1个。
每个PM2.5自动监测仪器,每个小时可完成一次PM2.5的测量,先把每一个点24小时内PM2.5的浓度相加除以24就得出每个点的日均浓度,然后把这十个点的日均浓度相加除以10,就得出了长沙市区PM2.5的日均浓度,这就是环保局网站上这个PM2.5数值的由来。
以近期某日(2015/5/15)为例,长沙十个观测点的数据分别如下
1
51.74
伍家岭
2
67.30
高开区
3
68.59
湖南中医药大学
4
71.26
雨花区环保局
5
74.22
经开区环保局
6
75.93
湖南师范大学
7
76.41
马坡岭
8
81.52
火车新站
9
84.56
天心区环保局
10
90.78
沙坪
由该图可以看出沙坪监测点的PM2.5日均浓度值最高,天心区、火车站次之,而伍家岭的浓度最低。
我认为主要的原因有以下几点:
首先看到湖师大及雨花区环保局监测点,它们地处大学校园附近,校园内绿地面积大,环境较好,空气质量较好,周围车流量比较少;其次说说火车新站监测点,地处闹市,属居民聚集区,周边的解放东路与朝阳路车流量比较多,同时靠近火车站,客运流量大。
且处于工厂密集区,属于市区人口稠密区域和主干道区,空气质量较差;同样,天心区、开福区、芙蓉区处市中心,高楼林立,易导致PM2.5的累积现象。
不得不提的是,沙坪区虽远离市区,但由于长沙全年基本盛行南方和东南风,沙坪处于北边,该处风速受主城区中高楼林立的影响,速度较慢,不利于PM2.5的扩散。
0~35
那么,我们如何根据PM2.5指数评定某一个地方的空气质量呢。
实际上,我们对PM2.5指数有做分级评定,分别如下
优
良 35~75 轻度污染75~115
115~150
中度污染
重度污染150~250严重污染大于250
及以上
当然这在统计学上就是一个的定序尺度的分析,能够帮助我们更好地解读数据,同时空气质量指标也会作为一个统计数据计入我的论文。
二、影响长沙PM2.5的因素简述
首先,我们有必要了解一下有关PM2.5形成原理。
在PM2.5形成中有两大主要来源,分别是自然源和人为源,其中,自然源包括土壤扬尘、海盐、植物花粉、孢子、细菌等。
自然界中的灾害事件,如火山爆发向大气中排放了大量的火山灰,森林大火或裸露的煤原大火及尘暴事件。
人为源指因人类活动而产生的PM2.5,包括固定源和流动源。
固定源包括各种燃料燃烧 源,如发电、冶金、石油、化学、纺织印染等各种工业过程、供热、烹调过程中燃煤与燃气或燃油排放的烟尘。
流动源主要是各类交通工具在运行过程中使用燃料时向大气中排放的尾气。
PM2.5可以由硫和氮的氧化物转化而成。
而这些气体污染物往往是人类对化石燃料(煤、石油等)和垃圾的燃烧造成的。
在发展中国家,煤炭燃烧是家庭取暖和能源供应的主要方式。
没有先进废气处理装置的柴油汽车也是颗粒物的来源。
燃烧柴油的卡车,排放物中的杂质导致颗粒物较多。
长沙从2013年开始施行AQI评价指标,因此我的数据也是从2013年开始,其中包括六个监测数据指标(SO2、NO2、PM10、PM2.5、O3和CO等)。
因为PM2.5有一部分就来自于各种硫化物氮化物和不完全燃烧的颗粒,因此我选择能从
AQI数据中看得到的NO,SO2,PM10(可吸入颗粒物,比PM2.5大一点),
CO,O3。
对五组指标分别与PM2.5数据两两进行定量的相关性分析。
同时,还应考虑各指标对PM2.5的综合影响,即测算复相关系数,又考虑到在对某一指标与PM2.5的相关性分析时,仍有可能受到其它指标的影响,即指标之间不是相互独立的,因此,需进一步测算偏相关系数。
从长沙空气质量指数AQI网站
(2013年10月28日到2015年六月的空气质量报告,约580个单日数据,说大不大说小不小,由于数据缺乏,同样统计指数又及其受季节因素影响。
在进行一系列的数据试验后,决定采用2014年全年数据进行相关度等的分析。
为了让统计分析继续下去,我们还是认为数据均服从正态分布吧。
三、影响长沙PM2.5的因素相关分析与显著性检验
首先,我们输入2014年全年数据,对单个数据进行分析,由于四季是一个轮回的过程,所以先不考虑季节影响,对各个指标求均值,可以得到如下报告:
Report
PM2.5 PM10 Co No2 So2
Mean 74.00 88.88 1.102683 39.62 23.03
5
One-SampleTest
TestValue=0
Sig.(2-
Mean
95%ConfidenceIntervaloftheDifference
t df
tailed)
Difference Lower Upper
PM2.5 29.921 368 .000 74.003 69.14 78.87
从2014年全年来看,PM2.5指数均值为74,且通过单样本T得到有95%把握认为均值为74。
检验根据以上的评级方法,可以说从均值而言,长沙的空气质量总体而言是良好的,那么我们可以据此我们认为长沙的空气并不是天天都是污浊的,更不是“不堪呼吸”的。
(1)五项指标与PM2.5间的相关分析
首先假设在分析两指标的相关性时,不会受到其它指标的影响,并绘制散点图,以判断两个变量有无相关趋势,以及趋势呈何种相关,再定量测定其相关系数。
那么我们先做有关散点图的工作,将PM2.5作为纵轴指标,各个因素作为横轴指标作直观的数据判断。
图1:
PM2.5与PM10数据散点图 图2:
PM2.5与CO数据散点图
图3:
PM2.5与SO2数据散点图 图4:
PM2.5与O3数据散点图
图5:
PM2.5与NO2数据散点图
可以看出,除O3,PM2.5与PM10、CO、SO2、NO2的散点分布大致呈左下-右上形态,同时,由于各变量值为连续型分布,故采用相关分析法对各组变量进行定量的相关性分析。
相关系数说明两个变量线性关系的密切程度和相关方向,以符号r表示样本的相关系数,运用数理统计教给我们的理论,计算方法为:
r=
𝑟𝑛‒2
∑(𝑥‒𝑥)(𝑦‒𝑦)
∑(𝑥‒𝑥)∑(𝑦‒𝑦)
,记为
𝑙𝑥𝑦
𝑙𝑥𝑥𝑙𝑦𝑦对此相关系数的统计检验使用t统计量:
t=
1‒𝑟2。
其计算方法可理解为两组向量夹角的余弦值。
设X=(𝑥1,𝑥2,𝑥3,…,𝑥𝑛)𝑇
, Y=
(𝑦1,𝑦2,𝑦3,…,𝑦𝑛)𝑇
从几何上粗略地讲,将两个向量平移至相同起点,则向量间的夹角大小可
7
以反映两者的相关性,具体而言,可用两向量夹角的正弦进行衡量,即有:
∑𝑛
𝑥𝑖𝑦𝑖
𝜌 =<𝑥,𝑦>
∑𝑛
𝑖=1
𝑥2
∑𝑛
𝑦2
𝑥𝑦
|𝑥||𝑦|=
𝑖=1𝑖
𝑗=1
𝑖。
相关系数r没有单位,其值为-1<=r<=1,r为正表
示正相关,r为负表示负相关。
其定义相关程度等级如下:
相关系数的值
相关程度等级
|r|=0
完全不相关
0<|r|<0.3
微弱相关
0.3<=|r|<0.5
低度相关
0.5<=|r|<0.8
显著相关
0.8<=|r|<1
高度相关
|r|=1
完全相关
将2014全年的数据进行彼此相关度检测,结果如下:
Correlations
PM2.5
PM10
SO2
NO2
O3
CO
PM2.5
PearsonCorrelation 1
.642**
.575**
.534**
.006
.706**
Sig.(2-tailed)
.000
.000
.000
.916
.000
N 365
365
365
365
365
365
PM10
PearsonCorrelation .642**
1
.558**
.542**
.284**
.348**
Sig.(2-tailed) .000
.000
.000
.000
.000
N 365
365
365
365
365
365
SO2
PearsonCorrelation .575**
.558**
1
.845**
-.147**
.549**
Sig.(2-tailed) .000
.000
.000
.005
.000
N 365
365
365
365
365
365
NO2
PearsonCorrelation .534**
.542**
.845**
1
-.275**
.563**
Sig.(2-tailed) .000
.000
.000
.000
.000
N 365
365
365
365
365
365
O3
PearsonCorrelation .006
.284**
-.147**
-.275**
1
-.335**
Sig.(2-tailed) .916
.000
.005
.000
.000
N 365
365
365
365
365
365
CO
PearsonCorrelation .706**
.348**
.549**
.563**
-.335**
1
Sig.(2-tailed) .000
.000
.000
.000
.000
N 365
365
365
365
365
365
**.Correlationissignificantatthe0.01level(2-tailed).
通过上表可以得出各变量对PM2.5变量的相关程度排名:
各变量对PM2.5相关程度排名:
指标
CO
PM10
SO2
NO2
O3
相关系数
0.706
0.642
0.575
0.534
0.006
相关方向
正
正
正
正
正
相关程度
显著相关
显著相关
显著相关
显著相关
微弱相关
重要程度
1
2
3
4
5
可以发现,除O3外,PM2.5与其他四类指标均具有较强的相关性,这在一定程度上印证了相关研究中的观点,即AQI监测指标中的二氧化硫(SO2),二氧化氮(NO2),一氧化碳(CO)等是在一定环境条件下形成PM2.5前的主要气态物体。
(2)PM2.5与其他五项指标相关性的显著性检验
实际上,对于相关性的检测要考虑两方面:
显著水平及相关系数。
在大样本情况下,受偶然因素的影响,两变量的相关系数可能较高,但实际上却并没有显著的相关关系。
因此,应对变量进行显著性检验以判断是否可以拒绝原假设,即两组变量有相互关系。
由于在上一环节中,O3与PM2.5之间几乎没有相关性,故在此,我们重点分析PM2.5与其他五项指标的相关性显著性水平。
Coefficientsa
UnstandardizedCoefficients
StandardizedCoefficients
Model
B
Std.Error
Beta
t
Sig.
1 (Consta
nt)
-41.233
4.643
-8.880
.000
So2
.513
.236
.123
2.171
.031
No2
-.345
.164
-.120
-2.108
.036
Co
69.031
4.553
.545
15.160
.000
PM10
.461
.037
.453
12.540
.000
a.DependentVariable:
PM2.5
可以看出,显著性检验所得结果与相关分析所得结果大致相似,其中,一氧化碳、PM10对PM2.5的线性相关性仍较显著。
其中,一氧化碳、PM10与PM2.5的显著性水平接近于0,即两者呈现极强的线性相关性,可以初步表明,PM2.5的形成与一氧化碳及PM10有较强的关系;同时,二氧化氮、二氧化硫与PM2.5
9
的线性相关在显著性水平为0.05时可以认为成立,但从另一方面考虑,SO2及
NO2与PM2.5的相关现象可能是以下原因所致:
PM2.5、二氧化氮、二氧化硫同时受到空气中某些成分的同向影响,在该类成分的影响下,PM2.5、二氧化氮、二氧化硫出现相同趋势的变化,进而导致在测算相关系数时误将这种同类趋势的变化当作PM2.5与二氧化氮、二氧化硫的相关性。
因此,我还有必要对PM2.5与其他指标进行偏相关系数分析。
(3)PM2.5与其他指标的偏相关系数分析
在多要素所构成的系统中,当研究某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视作常数(保持不变),即暂时不考虑其他要素影响,单独研究两个要素之间的相互关系的密切程度,所得数值结果为相关性系数。
由于此题中当研究其中一个指标与PM2.5的相关性时,由于受其他因素的影响,这时偏相关系数是一个不错的选择。
利用SPSS计算PM2.5与其它四个指标(PM10、CO、SO2、NO2)之间的偏相关系数,整理后结果如下:
各指标与PM2.5的偏相关系数
指标
PM10
CO
SO2
NO2
相关系数
0.547
0.627
0.112
0.110
相关方向
正
正
正
正
相关程度
显著相关
显著相关
微弱相关
微弱相关
重要程度
2
1
3
4
从上表可以看出,该结果在其他指标对PM2.5的相关程度排序上较为一致,但相关程度的等级相差较大。
CO、PM10相关系数仍较大,而SO2、NO2的相关系数大大降低,表明PM2.5主要还是和CO以及PM10有关,也就是说,不完全燃烧导致了最多的PM2.5。
四、结论
首先,长沙的空气质量2014全年而言是良好的,PM2.5指数为74,但是局部也有空气质量不好的日子。
从PM2.5成因来看,PM2.5成因与空气中的
SO2、NO2、PM10、CO有很大关系,因此治理PM2.5要从消除空气中的
SO2、NO2、PM10、CO入手,比如我们可以实行废弃达标排放、减少不完全燃烧等措施,具体种种,还需要我们共同的努力。
参考资料
[1]曾五一,肖红叶.统计学导论[M].科学出版社.2013
[2]张也影.流体力学.高等教育出版社.2002.2
[3]中国科学院数理统计组.常用数理统计方法.科学出版社.1974
[4]PM2.5的监测标准[J].中国苏州.2013-12-12
11