论文一审完成.docx

上传人:b****3 文档编号:4801066 上传时间:2023-05-07 格式:DOCX 页数:12 大小:272.07KB
下载 相关 举报
论文一审完成.docx_第1页
第1页 / 共12页
论文一审完成.docx_第2页
第2页 / 共12页
论文一审完成.docx_第3页
第3页 / 共12页
论文一审完成.docx_第4页
第4页 / 共12页
论文一审完成.docx_第5页
第5页 / 共12页
论文一审完成.docx_第6页
第6页 / 共12页
论文一审完成.docx_第7页
第7页 / 共12页
论文一审完成.docx_第8页
第8页 / 共12页
论文一审完成.docx_第9页
第9页 / 共12页
论文一审完成.docx_第10页
第10页 / 共12页
论文一审完成.docx_第11页
第11页 / 共12页
论文一审完成.docx_第12页
第12页 / 共12页
亲,该文档总共12页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

论文一审完成.docx

《论文一审完成.docx》由会员分享,可在线阅读,更多相关《论文一审完成.docx(12页珍藏版)》请在冰点文库上搜索。

论文一审完成.docx

论文一审完成

石家庄学院第二届大学生数学建模竞赛

承诺书

我们仔细阅读了石家庄学院大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

 

所属学院(请填写完整的全名):

计算机科学与工程学院

参赛队员(写上入学年月并签名):

1.王康

2.杨硕

3.杨博文

 

日期:

2014年5月26日

 

空气中颗粒物的分布及预测

摘要

随着越来越多的雾霾现象的发生,PM2.5开始进入人们的视线,空气质量问题也随之上升到国家战略问题。

但想要去治理与控制,就一定要知道其成因与客观规律,才能从科学的角度去治理。

因此,对这几个方面的研究无疑会有重大的意义。

对于问题一,本文通过对所给数据的整合,求出35个监测点一个月来PM2.5的平均值,并作出相应柱形图,确定了5个污染最严重的监测点。

对于问题二,选择计算相关系数来判断PM2.5与其他4项指标的相关性。

首先,不考虑指标间的相互影响,通过简单二元相关得到每个指标与PM2.5的相关系数,给出重要性排名。

进而判断4项指标之间的相关性。

考虑到每一项指标与PM2.5的相关性受其他指标影响,最终确定PM10是影响PM2.5的首要因素,并进行原因分析。

根据问题一确定的污染最严重的地区4月22日到5月22日PM2.5的相应数据,利用指数平滑法,得到对该监测点六月一日PM2.5全天24小时PM2.5的值的预测。

通过对模型的分析,得到问题三对模型的相应改进意见。

关键词:

回归分析;相关性系数;指数平滑法

 

第一章问题重述

可吸入颗粒物又称PM10,通常是指直径小于等于10.5微米的颗粒物。

细颗粒物又称PM2.5。

细颗粒物指环境空气中直径小于等于2.5微米的颗粒物。

PM10和PM2.5它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。

颗粒物的直径越小,进入呼吸道的部位越深。

10微米直径的颗粒物通常沉积在上呼吸道,5微米直径的可进入呼吸道的深部,2微米以下的可100%深入到细支气管和肺泡。

细颗粒物进入人体到肺泡后,直接影响肺的通气功能,使机体容易处在缺氧状态。

附件1中给出某地区35个监测站2014年4月22日-2014年5月22日每天24小时PM10和PM2.5和空气质量指数(AQI)的监测数据,附件2是35个监测站的位置。

(1)根据附件所给数据和污染物传播的原理从35个监测站所在位置中找出PM2.5污染较严重的5个位置;

(2)建立模型,预测污染最严重的那个监测站所在位置的2014年6月1号全天24小时PM2.5的值;

(3)如果要改进你的模型,你还需要哪些方面的数据并说明理由。

第二章模型假设

因PM2.5的扩散和衰减随机性较大,所受影响因素较多,突变情况繁杂,故对模型进行一定的假设,其结果均在假设条件下成立。

1)假设题目给出的各组数据真实可信,不考虑人为因素,具有统计、预测意义;

2)假设影响大气环境的各项因素不会出现非预期的剧烈变化;

3)不考虑突发事件或造成的空气质量突变;

4)空气质量相同等级的污染程度相同;

5)假设风速一定,且风向在一定时间内一定,不考虑突变因素、建筑物对风向的影响;

6)假设不考虑PM2.5的垂直分布。

第三章问题分析

问题一:

在问题一中,影响PM2.5的基本检测指标有4个。

其中PM2.5这个指标最为重要。

有一种研究认为,PM2.5监测指标中的PM2.5_24h,PM10,PM10_24h,AQI是在一定环境条件下形成PM2.5前的主要气态物体。

所以这五个指标之间可能存在相关性。

为了寻找到影响PM2.5的指标,需要将这五组指标分别进行相关性分析,找到其间的关系。

并分析其相关性,找到影响PM2.5的主要根源,进而引申出其他可能影响到PM2.5的因素,如降水、气候、温度、湿度、云层厚度和建筑物等因素。

问题二:

PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物。

它的直径还不到人的头发丝粗细的1/20。

虽然PM2.5只是地球大气成分中含量很少的组分,但它对空气质量和能见度等有重要的影响。

该地区PM2.5的时空分布及其规律可根据相关数据进行分析,并对分区进行评估,其结果将直接利用于以后的研究和预测。

考虑风力、湿度等天气和季节因素的影响,通过建立数学模型刻画该地区PM2.5的发生和演变规律。

在模型检验方面,应选择数据进行检验,并讨论了一系列影响因素。

问题三:

本文的模型是在一系列假设的基础上建立的,然而在实际生活中这些假设都是存在的,所以在对本文模型进行改进的时候,可以考虑突变天气和人为因素做变速运动对问题的影响,还有当发生异常事件时,考虑PM2.5浓度剧烈变化,从而对模型进行改进。

在建立模型是没有考虑降水以及不同风向对模型的影响,在以后的研究中可以考虑同时不同风向的影响以及降水、PH值、各种离子浓度对PM2.5浓度的影响。

PH值、以及酸雨对PM2.5可能存在一定的影响,PH值越高或者越低,该地区的PM2.5浓度值均有可能升高,温室效应会影响二次粒子的形成,从而控制PM2.5浓度值。

本文仅考虑了水平方向的分布,对于垂直分布未做研究,在以后的研究中可给予考虑。

第四章符号说明

Ρxy

相关系数

i,j

元素的角标

K,t

时刻

a,b

系数

Ck*

灰色关联系数

ξ(k)

曲线间差值

Z

全年平均的PM2.5浓度

Mi

每天生产的PM2.5质量

u(x,y,t)

位于(x,y)的t时刻的浓度

Mij

第t点第t天的PM2.5质量

Qi

每个点所占的权重

Zij'

影响因素

Si+

正理想解

Si-

可行解

Ci

经费/相近接近度

 

第五章问题一解答

本文通过对所给数据的整合,求出35个监测点一个月来PM2.5的平均值,并作出柱形图,确定了5个污染最严重的监测点。

由图可知五个污染最严重的地区分别为30、29、28、10、16。

第六章问题二解答及模型建立

6.1问题分析

在问题一中,影响PM2.5的基本检测指标有5个。

其中PM2.5这个指标最为重要。

有一种研究认为,PM2.5监测指标中的PM2.5_24h,PM10,PM10_24h,AQI是在一定环境条件下形成PM2.5前的主要气态物体。

所以这五个指标之间可能存在相关性。

为了寻找到影响PM2.5的指标,需要将这五组指标分别进行相关性分析,找到其间的关系,分析并判断各因素对PM2.5的影响程度,找到影响PM2.5的主要根源,进而引申出其他可能影响到PM2.5的因素。

除讨论的因素之外,降水、季节、温度等会产生一定的影响,因此,需要进行讨论分析。

6.2回归分析

6.2.1回归分析的内容

(1)提供建立有相关关系的变量之间的数学关系式(称为经验公式)的一般方法;

(2)判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著的;

(3)利用所得到的经验公式进行预测和控制。

6.2.2一元线性回归

首先考虑最简单的回归方程进行回归分析。

一元线性回归模型:

称Y与x之间存在线性回归关系,其中的参数a与b称为一元线性回归的回归系数。

采用最小二乘法,求观测值与期望值的离差平方和最小。

为分析五种指标之间的相关性与独立性,首先这里选取资料更加全面的北京市的空气检测数据,然后选取PM2.5_24h与PM2.5的数据进行分析,进而得到两者的相互关系。

为观察明显,首先画出两者与时间的散点图如下(蓝色表示PM2.5,红色表示PM2.5_24h)

图1PM2.5与PM2.5_24h的相关性

通过观察可以发现,其相关性较大,趋势相近,进而做出两种因素下的散点图,分析其函数关系。

图2表示PM2.5与PM2.5_24h的相关散点图

由图中可以发现,即使通过前一张图发现其趋势相同,但两者并无严密的线性或其他函数关系。

所以针对此种情况,不能单一地从回归分析得到结论,所以应采取其他方法去判断。

这就提出了相关性系数分析法。

6.3相关性系数分析

针对这个问题,分析出变量间的相关性涉及到变量或变量组之间的多种相关性,这里分为三种情况分别讨论与分析。

五项指标与PM2.5相关性:

首先,我们假设其余五项指标对于PM2.5分别独立,来分析每项指标与其的相关性与独立性。

这就是一个二元简单相关问题。

衡量两个变量之间的相关性利用相关系数,其价值在于定量刻画两个数据向量的相似程度。

从几何上粗略地讲,将两个向量平移至相同起点,如果它们位于同一直线上,则有理由认为二者完全相似。

即使二者不重合,但如果两向量的夹角较小,则也可以认为二者较相似。

因此,用两向量夹角(希尔伯特空间)的正弦衡量其相似性是科学的,即有

通常称上式为两变量的相似系数。

衡量X与Y的相关程度,上式被称为相关系数。

定义相关程度如下表所示:

相关系数的值

相关程度

|ρ1|=0

完全不相关

0<|ρ1|≤0.3

微弱相关

0.3<|ρ1|≤0.5

低度相关

0.5<|ρ1|≤0.8

显著相关

0.8<|ρ1|≤1

高度相关

|ρ1|=1

完全相关

为把相关性体现地更明显,将其进行归一化处理。

这里使用的方法是:

X1=X/Xmax

经处理得到4个指标与PM2.5的相关性系数如下表:

指标

PM2.5_24h

PM10

PM10_24h

AQI

相关系数

0.77378

0.871215

0.742

0.770082

相关方向

正相关

正相关

正相关

正相关

相关程度

显著相关

高度相关

显著相关

显著相关

通过观察可知,其中PM10的相关性最大,可见PM10与PM2.5几乎会同时出现,这可能与施工扬尘等有关。

PM2.5_24h、PM10_24h、AQI这三种气体,相关性也较大,说明主要因为工业污染,尾气排放等因素导致了PM2.5的浓度上升。

6.4指数平滑法预测

指数平滑法是生产预测中常用的一种方法。

也用于中短期经济发展趋势预测,所有预测方法中,指数平滑是用得最多的一种。

简单的全期平均法是对时间数列的过去数据一个不漏地全部加以同等利用;移动平均法则不考虑较远期的数据,并在加权移动平均法中给予近期资料更大的权重;而指数平滑法则兼容了全期平均和移动平均所长,不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。

也就是说指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测。

其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。

指数平滑法的基本公式是:

St=ayt+(1-a)St-1式中,

St--时间t的平滑值;

yt--时间t的实际值;

St-1--时间t-1的平滑值;

a--平滑常数,其取值范围为[0,1];

由该公式可知:

1.St是yt和St-1的加权算数平均数,随着a取值的大小变化,决定yt和St-1对St的影响程度,当a取1时,St=yt;当a取0时,St=St-1。

2.St具有逐期追溯性质,可探源至St-t+1为止,包括全部数据。

其过程中,平滑常数以指数形式递减,故称之为指数平滑法。

指数平滑常数取值至关重要。

平滑常数决定了平滑水平以及对预测值与实际结果之间差异的响应速度。

平滑常数a越接近于1,远期实际值对本期平滑值的下降越迅速;平滑常数a越接近于0,远期实际值对本期平滑值影响程度的下降越缓慢。

由此,当时间数列相对平稳时,可取较大的a;当时间数列波动较大时,应取较小的a,以不忽略远期实际值的影响。

生产预测中,平滑常数的值取决于产品本身和管理者对良好响应率内涵的理解。

3.尽管St包含有全期数据的影响,但实际计算时,仅需要两个数值,即yt-1和St-1,再加上一个常数a,这就使指数滑动平均具有逐期递推性质,从而给预测带来了极大的方便。

4.根据公式S1=ay0+(1-a)S0,当欲用指数平滑法时才开始收集数据,则不存在y0。

无从产生S0,自然无法据指数平滑公式求出S1,指数平滑法定义S1为初始值。

初始值的确定也是指数平滑过程的一个重要条件。

如果能够找到y1以前的历史资料,那么,初始值S1的确定是不成问题的。

数据较少时可用全期平均、移动平均法;数据较多时,可用最小二乘法。

但不能使用指数平滑法本身确定初始值,因为数据必会枯竭。

如果仅有从y1开始的数据,那么确定初始值的方法有:

1)取S1等于y1;

2)待积累若干数据后,取S1等于前面若干数据的简单算术平均数,如:

S1=(y1+y2+y3)/3等等。

根据第30个预测的4月22日到5月22日的数据,利用指数平滑法画出相应的曲线图如下:

第30个监测点6月1日24小时预测结果如下:

时刻

PM2.5预测值

误差

0

232.5079

19.81808

1

224.1016

18.40178

2

219.2203

17.33718

3

205.4441

12.16804

4

196.2888

12.44635

5

203.2578

12.95364

6

207.8516

8.941004

7

213.5703

7.302018

8

205.9141

7.652112

9

212.3828

8.328136

10

224.8766

11.55955

11

246.5753

18.66333

12

260.5151

20.68169

13

247.303

20.9129

14

244.6606

13.99139

15

216.1321

22.76939

16

188.0264

28.96466

17

184.8053

28.99515

18

193.7611

21.41495

19

157.1522

27.2984

20

69.03044

69.16865

21

27.40609

75.13266

22

15.88122

70.82422

23

14.37624

31.18889

第七章模型的改进方向

本文的模型是在一系列假设的基础上建立的,然而在实际生活中这些假设都是不存在的,本文针对问题已所采用求平均值的方法存在一定的误差,根据一个月的数据利用指数平滑法预测,本身也存在一定的误差。

所给的数据仅仅是一个月的数据,真实性和完整性在一定程度上得不到满足,并且PM2.5的值本身受温度,降雨等因素影响,在函数预测时不能将这些因素考虑在内,真正预测PM2.5的值应该考虑气温、气压、天气、温度、降雨等一系列因素对PM2.5的影响,实际情况和函数没有那么大的关联性。

导致预测结果和实际结果存在一定的偏差。

在这些方面可以做一些改进,把影响PM2.5值的因素尽量完整地找出来,求出其相关性系数,再根据更完整的数据进行拟合,考虑温度、降水等因素对PM2.5的影响,从而做出更精确的预测。

指数平滑法建立的模型进行大幅度变量长期预测时就会产生较大的偏差。

PM2.5一方面包括自然过程,但主要来源还是人为排放。

人类既直接排放PM2.5,也排放某些气体污染物,在空气中转变成PM2.5。

直接排放主要来自燃烧过程,比如化石燃料(煤、汽油、柴油)的燃烧、生物质(秸秆、木柴)的燃烧、垃圾焚烧。

其它的人为来源包括:

道路扬尘、建筑施工扬尘、工业粉尘、厨房烟气。

这些人为活动是不确定的对长期的预测有很大的干扰。

所以建模时要考虑到这些人为的活动。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2