建模论文.docx
《建模论文.docx》由会员分享,可在线阅读,更多相关《建模论文.docx(10页珍藏版)》请在冰点文库上搜索。
建模论文
A城市空气污染数据的真实性判别及分析研究
摘要
随着我国工业水平的发展,空气污染问题也成为了我们密切关注的问题之一,但是如何判断空气质量数据的真实性以及如何提高数据的真实性成为我们关注的重点。
我们收集各大城市往年的空气监测数据,并利用MATLAB拟合的方法进行数据分析以及双变量相关性分析的方法对空气数据的不真实性进行了监测和分析。
首先我们对AQI(空气质量指数)与空气污染物浓度在MATLAB中进行了拟合,找出与AQI相关程度较高的污染物,并得到一个相关系数。
通过AQI指数计算公式我们列出AQI与相应污染物浓度的分段函数,并且代入污染物浓度求出AQI新的指数,再将新的AQI与原始的AQI进行拟合得出新的相关系数,对两次的相关系数进行比较,可以初步判定该城市是否存在数据造假的可能性。
一.问题重述
1.1引言
空气质量问题始终是政府、环境保护部门和全国人民关注的热点问题。
空气质量和环境污染问题和我们每一个人的生活息息相关,而且一直以来他就是中国发展所面临的主要问题。
尽管中国有一个相对全面的系统的空气污染监管,但收集到的空气数据往往会因为各种原因呈现一定的异常,如何才能从大量的空气质量数据中判断是否存在异常的数据,如何才能使空气检测数据更加真实可信,这边需要我们找到一种可以迅速找出异常空气数据的有效方法。
然而,由于各种主客观原因,会使所采集到的数据序列体现出一定的异常现象。
1.2问题的提出
在上述问题背景的基础上,结合题目所给的资料,建立数学模型讨论以下的问题:
问题一:
搜集相关的数据,建立数学模型寻找相应的指标来判断空气质量数据是否存在不真实的现象。
问题二:
在第一问的基础上,考虑污染物之间的相互关联的性质或者利用污染物随时间变化的连续性,从时间、空间角度进行对比,以此来确定数据不真实性是否存在并且讨论其严重性。
问题三:
通过所建立的数学模型分析数据不真实的类型、原因,最终为环境保护和政策制定提供支撑。
问题四:
在对空气质量数据的进一步的讨论中加入社会因素,查找空气质量和工业生产等数据的相关性,并说明是否可以通过空气质量数据的变化来展示工业生产数据的实际情况。
二、问题分析
2.1问题一、问题二的分析
本文所研究的问题一、问题二主要采用拟合分析。
根据对AQI指数和污染物浓度拟合后的污染物相关系数找出与AQI指数相关程度较大的污染物,将此污染物称为相关污染物,用IAQI的计算方法,算出相关污染物的IAQI值,假设IAQI指数就是AQI指数,将相关污染物的AQI值与原来的AQI值进行拟合,求出AQI相关系数将此相关系数与污染物相关系数进行比较,如果前者大于后者则说明该地区修改AQI值的可能性较小,造假可能性较小;如果前者小于后者则说明该地区修改了AQI值,造假可能性较大。
对于研究多种污染物之间的相关性我们采用了建立多元线性回归方程的方
法来找到AQI的值和各种污染物之间的关联度,并据此进一步的研究数据异常的
问题。
而且根据污染物变化的连续性我们可以运用异常数据连续性的中断来研究
具体污染物的数据所出现的问题。
2.2问题三的分析
通过对问题一、问题二的分析,对数据不真实的情况进行分类和总结,将不
真实的情况分为不同的类型并且结合模型和实际情况找出数据不真实的原因,
并针对不同的类型和产生原因为环境保护和政策制定提出一些有实际意义的建
议。
2.3问题四的分析
加入社会因素,利用空气质量数据的变化来展示社会因素变量的变化,可以借助SPSS对这两个变量进行相关性检验来分析。
如果这两个变量的变化趋势已知,存在一定的相关性,那么就可以通过空气质量数据的变化来反应社会因素变
量。
三、假设条件
(1)假设题目所提供的数据中污染物浓度不存在造假现象,数据造假只存在AQI值中。
(2)假设除了空气污染物含量外其它因素不会影响AQI值。
(3)假设对AQI值的影响很小,可以忽略。
(4)不考虑极端天气对空气污染物含量的影响。
四、符号说明
五、模型的建立与求解
空气质量和环境污染问题一直以来就是中国发展所面临的主要问题。
尽管中国有一个相对全面的系统的空气污染监管,但对地方政府实现标准仍是一个大问题。
在第11个五年计划期间,一个城市的自动监测系统得分与当年出现蓝天日(当天的API<=100)的天数有很大的关系。
然而,由于一些性能指标难以监测和验证,中央政府必须依靠地方政府报告的数据,并且城市的空气质量评级开始在干部晋升体系中占有一定的比重。
如此一来,一些领导干部为了个人利益考虑,经常操纵统计数据,横加干涉不符合自己意图的统。
因此就出现了空气质量和气
候数据不真实的问题。
对于如何判断空气质量数据是因各种人为因素的干预而呈现不真实性这一问题,我们对数据进行拟合分析,通过分析后的相关系数的对比来判断是否存在造假现象。
5.1问题一,二数学模型的建立与求解
5.1.1拟合分析
(1)判断是否造假的原理
在我们现实的生活中可能会存在着这样一种情况,那就是当某城市空气质量指数刚刚划分空气质量指数级别的区间,此时当地政府会小幅度的修改AQI值,让该地区的空气质量指数级别降低一级;假如某地区当天的AQI值是105,空气质量指数是三级(轻度污染),当地政府将AQI值小幅度修改为98,这样的话空气质量指数就会由原来的三级(轻度污染)降级变成二级(良),这样就产生了造假现象。
但是根据参考文献【2】中给出的AQI指数的计算方法,我们知道,AQI指数的取得在计算出的各个污染物的IAQI值中取出最大值作为AQI指数,在某个地区一定会有对AQI产生主要贡献的污染物,我们对各个污染物的浓度
和AQI指数在MATLAB中进行拟合分析,找出相关程度较高的污染物,我们称为相关污染物,并且得到它们的AQI和
的相关系数
,
……我们假设AQI值就是该相关污染物的IAQI值,该污染物浓度与AQI指数的相关系数为
,然后通过公式
(1)计算出相关污染物的IAQI值后将它作为新AQI指数,将这个新AQI指数与原始AQI指数在MATLAB中进行拟合得出相关系数
,将
和
进行比较,前者较大那就说明造假可能性较小,如果前者较小那就说明造假可能性较大。
因为AQI的值是由污染物引起的,所以相关污染物的浓度与AQI值的相关系数
是一定的,那么由相关污染物计算出的新AQI值与原AQI值的相关系数
也是一定的,而且两者几乎相等,如果某地区修改了AQI值进行造假,就会造成AQI指数与相关污染物之间的相关性降低,那么它修改后的相关性系数
会比实际的相关性系数
小,因此造成了修改后的
值小于
,由次判断某地区是否造假。
(2)以北京和沧州为例用拟合的方法进行分析
我们把北京的数据导入MATLAB中,将北京市的PM2.5,PM10,NO2,SO2,CO的污染物浓度值分别和它的AQI值进行拟合得到的图像如下所示:
图
(2)NO2与AQI
图
(1)CO与AQI
图(4)PM10与AQI
图(3)PM2.5与AQI
图(5)SO2与AQI
由图
(1),
(2),(3),(4),(5)可以看出对于北京市来说PM2.5和PM10分别对AQI拟合程度较高,所以PM2.5和PM10是北京市的主要污染物。
由参考文献[2].《环境空气质量指数(AQI)技术规定(试行):
中华人民共和国国家环境保护标准》中可以得出AQI指数的计算方法如下:
污染物项目P的空气质量分指数按式
(1)计算:
(1)
式中:
——污染物项目P的空气质量分数;
——污染物项目P的质量浓度值;
——表1中与
相近的污染物浓度限值的高位值;
——表1中与
相近的污染物浓度限值的低位值;
——表1中与
对应的空气质量分指数;
——表1中与
对应的空气质量分指数;
空气质量指数计算方法
空气质量指数按式
(2)计算:
(2)
由上述计算方法我们可以列出PM2.5IAQI指数的分段函数如下:
将数据中PM2.5的浓度带入该分段函数中就可以求出PM2.5的IAQI值,将这个PM2.5的IAQI值作为新AQI值并且与原始的AQI值进行拟合得到的图像如下:
图(6)新AQI与AQI拟合图像
由图(6)可得新AQI与AQI相关系数R-square=
=0.9307
由图(3)可得PM2.5与AQI相关系数R-square=
=0.9305
由于
=0.9307>
=0.9305所以可以说明北京市没有进行数据造假。
同理,我们对沧州的数据进行了分析得到的图像如下所示:
图(8)沧州新AQI与AQI
图(7)沧州PM2.5与AQI
由图(7)可得沧州PM2.5与AQI相关系数R-square=
=0.9128
由图(6)可得新AQI与AQI相关系数R-square=
=0.9102
由于
=0.9102>
=0.9128所以可以说明沧州市可能进行了数据造假。
使用这种方法可以判定某个城市是否存在空气质量造假的现象。