1数学建模论文Word格式.docx
《1数学建模论文Word格式.docx》由会员分享,可在线阅读,更多相关《1数学建模论文Word格式.docx(102页珍藏版)》请在冰点文库上搜索。
本文对某城市城区土壤中Hg、Pb、Cd、As、Zn、Cu、Ni和Cr8种重金属进行分析,运用投影寻踪模型对该城区内不同区域重金属的污染程度给出评价;
运用地统计学模型与GIS研究了重金属的空间分布特征,进行了相应的污染评价,并在此基础上对重金属污染影响因素定量分析,确定了污染源的位置。
最后,为研究城市地质环境的演变提供模式。
主要内容如下:
1、针对问题一,运用了基于蛙跳算法的投影寻踪模型,对城市表层土壤重金属污染综合指标作出评价,得到了重金属对城市表层土壤污染综合评价指标的影响程度,从大到小依次为:
Cd>
Pb>
Cu>
Hg>
Zn>
Cr>
As>
Ni。
并且对该城市各区表层土壤重金属整体污染水平作出评价,其结果为:
工业区和交通区表层土壤重金属污染水平明显高于其他区域,山区表层土壤重金属污染处于最低水平。
2、针对问题二,对每种重金属元素在每个区域的数据求其平均值,与背景值进行比较,分析了该城市不同区域造成重金属污染的主要原因。
3、针对问题三,运用地统计学模型给出了该城区8种重金属元素空间分布图,对土壤金属作了空间变异分析,得出区域内As、Cr含量空间相关程度较高,Pb受随机因素和不确定因素的影响很大,局部污染会造成重金属的大量聚集。
Cd,Cr,Cu,Hg,Ni,Pb,Zn受随机因素的影响较大,导致在较小的范围内存在相关关系。
同时用坐标确定了污染源的位置,结果显示污染源主要集中在工业区,交通区和生活区,也就是说这几个区域是重污染区。
Cd、Hg、Pb、Zn在该城区的污染源出现两个,As在该城区的污染源出现三个。
4、最后,分析了所建模型的优缺点,进一步完善模型,使其更具有通用性,能够更加全面,准确的获得城市地质环境演变的内在模式,为城市建设的合理开发提供依据和参考。
关键词:
投影寻踪;
综合评价;
空间分布;
半变异函数;
污染源
一、问题的提出
改革开放以来,随着经济的高速发展,环境污染问题变得日益严峻,人类活动严重影响了生态系统的平衡。
由于土壤污染具有滞后性、隐蔽性和长期性等特征,所以土壤污染引起的食物安全问题和生态安全问题往往不能引起人们足够的重视。
随着近代工农业的发展,工业城市污染的加剧和农用化学物质种类、数量的增加,土壤重金属污染日益严重,污染程度加剧,面积逐年扩大。
重金属污染己成为当今世界倍受关注的一类公害。
由于重金属污染物在土壤中移动性差、滞留时间长、不能被微生物降解,并可经水、植物等介质最终影响人类健康。
因此,土壤重金属污染问题己经成为当今环境科学研究的重要内容[1]。
随着城市化、工业化的迅速发展和人类环境意识的增强,许多发达国家对其土壤的重金属污染问题兴趣不断增加[2],进入新的世纪,中国的许多城市也相继开展了陆地生态系统与水生生态系统中重金属分布规律与污染状况方面的研究[3],为重金属污染的后续研究奠定了基础。
但是,对于土壤重金属的污染研究还存在诸多问题,例如:
土壤背景值的确定,不同评价方法的选用,重金属空间分布特征的研究,污染的影响因素分析,污染的时间预测等,都有待进一步研究。
二、问题的假设
一条件假设
(一)假设每个采样点的数据都是准确有效的;
(二)假设污染物传播过程与风向无关;
(三)假设重金属传播的速度是匀速的;
(四)假设每个采样点的数据都是该地区每公里的实际情况。
二符号假设及名词解释
(一)符号假设
——半变异函数
——
的数学期望
——分别为空间区域内距离为
的2个位置观测值
——加权因子
——距离为
的位置观测值的个数
x*(i,j)——第i个样本第j个指标,m,n分别为样本的个数(样本容量)和指标的数目
a={a1,a2…,an}——为投影方向向量,是单位长度向量。
x(i,j)——经过归一化处理后的评价指标集
xmax(j)、xmin(j)——分别为第j个指标值的最大值和最小值
Si————投影值的标准差,为类间距离
(二)名词解释
(1)投影寻踪[5]:
投影寻踪(ProjectionPursuit,简称PP)是用来分析和处理高维观测数据,尤其是非正态、非线性高维数据的一类新兴探索性统计方法。
(2)地统计学[6]:
一种区域化变量的分析方法,其主要目的是结合采样点提供的信息对未知点进行估计和模拟。
三、模型的建立
一针对问题一,建立投影寻踪模型
针对城市表层土壤重金属污染评价指标的不相容性问题,提出了基于蛙跳算法投影寻踪模型的城市表层土壤重金属污染综合指标评价方法。
该方法根据样本数据特性寻求最优投影方向,利用最优投影方向判断各评价指标对综合评价目标的贡献大小,根据最优投影方向与评价指标的线性投影得到投影值,实现对样本的统一评价。
投影寻踪模型不受限于问题规模,可实现高维数据降维操作,在低维空间内对数据进行统一评价。
利用蛙跳算法投影寻踪模型对城市表层土壤重金属污染程度进行整体分析,得出各重金属标对整体城市表层土壤重金属污染水平的影响权重及各区域污染程度的排序,为相关部门提供决策参考信息。
(一)混合蛙跳算法
混合蛙跳算法[4]基本原理:
在定义空间内分布着P只青蛙组成的种群,第i只青蛙的位置代表定义空间的一个解Xi=(xi1,xi2,…,xis),s为维数空间。
首先计算出每个解的适应值F(Xi),将P只青蛙按适应值降序排列,然后将整个青蛙种群划分为M个子群,每个子群包含N个解。
在迭代过程中,第一个解进入第一个子群,第二个解进入第二个子群,一直分配下去,直到第M个解进入到第M个子群,之后,第M+1个解进入到第一个子群,第M+2个解进入到第二个子群,以此类推,直到所有解分配完为止。
局部搜索:
每个子群中,适应值最好的解和适应值最差的解分别记为Pb和Pw,群体中适应值最好的解记为Pg。
每次迭代过程中,对每个子群的Pw进行更新操作,更新策略如公式
(1),
(2)。
(1)
(2)
式中,R是0到1之间的随机数,Dis是Pw的移动步长,DisM是青蛙移动步长的上限,如果Pwk+1的适应值优于Pwk的适应值,则用Pwk+1代替Pwk,否则用Pg替换Pb重复执行式
(1),
(2)。
如果仍没有改进,则在定义域内随机产生一个新解取代Pw,在固定迭代次数内继续执行以上操作,完成SFLA的一次局部搜索。
全局信息交换:
经过规定次数的局部搜索后,将各子群青蛙个体混合在一起,按适应值降序排列,重新划分子群,这样使得青蛙个体间的信息得到充分的交流,然后继续进行局部搜索,如此反复直到满足收敛条件为止。
(二)基于混合蛙跳算法的投影寻踪模型
它的基本思路是:
利用计算机技术,把高维数据通过某种组合投影到低维空间,用低维空间中投影散点的分布结构揭示高维数据的结构特征,或根据该投影值与研究系统的输出值之间的散点图构造数学模型及预测系统的输出。
因此,投影寻踪实质上是一种解决复杂高维问题的简化模型。
投影寻踪模型建模方法:
步骤1:
投影指标的建立。
设各指标值的样本集为{x*(i,j)|i=1,2,3,…,m,j=1,2,3,…,n},为消除各项指标的量纲和统一指标的变化范围,首先应进行归一化处理,本文采用下式进行数据的归一化处理。
对越大越优型指标采用公式(3)计算,对越小越优型指标采用公式(4)处理。
(3)
(4)
步骤2:
构造投影指标函数。
投影寻踪实质是寻找最能充分表现数据特征的最优投影方向,设a={a1,a2…,an}为一n维单位向量,投影寻踪方法就是把经归一化处理后的n维评价指标x(i,j)投影到a上,得到对应的一维线性空间投影值z(i)。
(5)
a(j)在[0,1]之间取值,然后根据{z(i)|i=1,2,…,n}的一维散布图进行分类。
综合投影指标值要求投影值z(i)的散布特征应为:
局部投影点尽可能密集,最好凝聚成若干个点团,而在整体上投影点团之间尽可能散开。
因此,投影指标函数可以表达成
(6)
Sz越大,散布越开;
Dz为投影值的局部密度,Dz越大,聚类越显著。
Sz和Dz按公式(7)和(8)计算。
(7)
(8)
式中,E(z)为序列{z(i)|i=1,2,…,n}的平均值;
r(i,j)为样本之间的距离,r(i,j)=|z(i)-z(j)|,R为局部密度的窗口半径,它的选取既要使包含在窗口内的投影点的平均个数不太少,避免滑动平均偏差太大,又不能使它随着n的增大而增加太高,可以根据试验来确定[9],本文中R的取值为0.1Sz。
u(R-r(i,j))为一单位阶跃函数,当R≥r(i,j)时,其函数值为1,当R<r(i,j)时,其函数值为0。
步骤3:
采用混合蛙跳算法优化投影指标函数。
当各指标值的样本集给定时,投影指标函数Q(a)只随着投影方向a的变化而变化。
不同的投影方向反映不同的数据结构特征,最优投影方向就是最大可以暴露高维数据某类特征结构的投影方向,因此可以通过求解投影指标函数最大化问题来估计最优投影方向,即
最大化目标函数:
(9)
约束条件:
这是一个以a为优化变量带约束条件的复杂非线性优化问题,用传统的优化方法处理比较困难,而混合蛙跳算法在处理此类问题方面具有良好的的寻优能力。
因此,本文采用混合蛙跳算法对最大化目标函数进行求解。
步骤4:
计算投影值(排序)。
把由步骤3求得的最优投影方向a代入式(5)后可得各样本点的投影值,z(i)按大小排列的顺序即样本的优劣顺序。
二针对问题三,建立地统计学模型,得到重金属元素在该空间的分布,对土壤金属作空间变异分析,推断出污染源的位置
地统计学[6]是一种区域化变量的分析方法,其主要目的是结合采样点提供的信息对未知点进行估计和模拟,半方差函数是地学统计中的主要工具,一方面是利用半方差函数对参数的空间分布进行结构分析和变异性分析,另一方面是应用结构分析的结果和克里格法进行插值。
半变异函数的数学表达式为:
(10)
在实际数据运算中,式(10)可写成:
.(11)
公式(11)计算出的实验半方差函数值只是不同方向上的一些不连续的点.需要经过理论模型拟合得到理论模型.土壤重金属分析中常用的模型是球状模型和指数模型,其表达式分别为
(12)
(13)
在拟合中会得到3个基本参数C0,C和R。
C0:
块金值,反映了随机因素或不确定因素对变量空间相关性的影响;
C:
结构方差,反映了结构因素或确定因素对区域化变量空间自相关性的影响;
R:
变程,反映了区域化变量在空间上具有相关性的范围.
由实验半方差函数拟合的理论模型经过交叉验证确定其合理性后便可以用于估值,若交叉验证结果平均误差趋近于0,且服从正态分布,95%的置信区间应在正负2倍的克里格方差范围内则认为其结果是合理的[7]。
四、模型的求解
一通过投影寻踪模型,对该城区不同区域的重金属污染程度做出整体评价
附件2列出了8种主要重金属元素在采样点处的浓度。
通过对这8项重金属元素浓度指标的分析,对该城区的重金属污染程度做出整体评价。
混合蛙跳算法执行过程中选定种群规模为12只青蛙,分为3个子群,每个子群含4只青蛙,进化迭代次数为500,子群内更新迭代次数为3。
通过模型运算得到最大投影指标值为:
105281.481,最优投影方向向量a=(0.213446,0.582665,0.222517,0.317227,0.316942,0.194719,0.490734,0.292590,),最优投影方向各分量的大小实际上反映了各评价指标对城市表层土壤重金属污染综合评价指标的影响程度,其从大到小依次为:
Cd(0.582665),Pb(0.490734),Cu(0.317227,)Hg(0.316942),Zn(0.292590),Cr(0.222517),As(0.213446),Ni(0.194719)。
对同一区域的的重金属元素分析投影向量对应的投影值是反映城市表层土壤重金属污染水平的综合因子。
即求出属于同一区域的采样点投影值的平均值作为该区域的代表进行评价,Z(工业区)=0.244261,Z(交通区)=0.206737551,Z(生活区)=0.211617205,Z(公园绿地区)=0.159219686,Z(山区)=0.118342273。
由此得到城市各区表层土壤重金属污染水平直方图如下(图1)。
图1城市各区表层土壤重金属污染水平
从图1可以看出,工业区表层土壤重金属污染水平最高,工业区和交通区表层土壤重金属污染水平明显高于其他区域,山区表层土壤重金属污染处于最低水平。
二重金属污染的主要原因分析
对每种重金属元素在每个区域的数据求其平均和背景值进行比较得到表1,图2和图3。
表1各区域重金属浓度平均值与背景值
元素
范围
背景值
生活区
工业区
山区
交通区
公园绿地区
As
1.8~5.4
3.6
6.27
7.25
4.03
5.73
6.26
Cd
70~190
130
289.96
393.11
154.36
360.54
280.54
Cr
13~49
31
69.02
58.91
38.77
58.29
43.64
Cu
6.0~20.4
13.2
49.4
127.59
17.25
62.56
30.19
Hg
19~51
35
93.04
642.36
90.61
449.95
114.99
Ni
4.7~19.9
12.3
18.34
19.81
15.38
17.67
15.21
Pb
19~43
69.11
36.46
63.78
60.71
Zn
41~97
69
237.01
27.93
73.15
244.16
154.24
图2各区重金属元素浓度与背景值的对比图3各区重金属元素浓度与背景值的对比
由图2和图3表得到以下结论:
生活区超标的主要重金属元素是Cd、Zn,Hg和Pb。
由于在生活区的电池大量使用及对废旧电池的回收利用率较低等原因,导致废旧电池中含有的大量Cd元素的外泄。
交通区与生活区穿插导致生活区的Pb含量不断上升。
生活区与工业区的混合,导致生活区分布大量由电镀、采矿、冶炼等化工企业排放的含有过量Zn,Hg等重金属元素。
所以生活区重金属污染的主要原因是工业区和交通区穿插所造成的。
工业区超标的重金属元素是Cu、Cd和Hg。
在这个区域广泛分布着采矿、冶金、化学制药、蓄电池、冶炼等高污染的企业。
而且在工业生产过程中广泛使用重金属元素,工矿企业将未经严格处理的废水、废渣、废气直接排放,使得它们周围的土壤容易富集高含量的有毒重金属。
所以工业区的污染来自于自身。
山区超标的重金属元素是Hg和Cd。
由于山区土壤中本身就含有重金属矿质,所以采样时导致它所含的重金属超标。
交通区超标的重金属元素是Cd、Pb、Cu、Hg和Zn。
以公路、铁路为中心成条带状分布的重金属污染土壤主要是由于汽车尾气的排放、汽车轮胎磨损产生的大量含重金属的有害气体和粉尘的沉降所引起的,污染元素中主要为Pb、Cd、Pb、Cu、Zn等元素。
这些物质随风飘落,进入土壤中引起重金属污染。
实验证明,道路两旁土壤中重金属的污染比较严重,并随着离公路距离的由近到远,土壤的污染程度渐轻。
公园绿地区超标重金属元素是Cd、Hg和Zn。
由于公园区外围遍布着交通区,所以公园绿地区的重金属污染是来自周围临近地区扩散的污染物。
三运用地统计学模型给出了该城区8种重金属元素空间分布图,对土壤金属作空间变异分析,确定了污染源的位置。
(一)土壤金属空间变异分析
土壤金属空间变异分析是通过对半变异函数的计算和拟合,将重金属空间变异特征定量化、模型化、计算出主要参数C0,C及R,从而揭示出影响重金属空间变异的主要因素和作业方式。
在土壤重金属变异中,C0属于随机变异,反映了随机因素(如社会经济因素)引起的空间变异;
C反应了土壤母质、地形、气候等非人为因素引起的变异;
R反映了土壤重金属含量在空间的最大相关距离,在R以外,重金属含量在空间是独立的,在R内,重金属含量是空间相关的;
C0+C反映了自然因素(如土壤母质,地形等)和社会经济(如施肥等)共同引起的空间变异[8]。
在空间变异分析中,常用C0/C0+C的比值作为相关程度的尺度,该比值小于0.25,则该变量的空间相关程度较强;
该值在0.25—0.75之间,则变量为中等程度的相关空间;
该值大于0.75,则是空间弱相关。
通过使用地统计学模型,利用VC++软件编程(代码见附录)对附件1和2的部分数据(选择分属不同区域的120个采样点)进行数值计算,选择有代表性的散点,分别绘制出八种重金属元素的半变异函数图,如图4所示。
图48种重金属半变异函数图
在数据处理时,分别选择每种重金属数据中部分近似服从正态分布的散点(散点总数的10%),利用蛙跳算法分别对8种重金属进行半方差分析.经过反复比较,As和Cr用球状模型拟合的效果最佳,其他6种用指数模型拟合的效果最佳,拟合后的半变异参数见表2.
表28种重金属的半变异参数
重金属
模型
C0(块金值)
C(结构方差)
R(最大变程/Km)
C0/(C0+C)/%
As(μg/g)
球状
0.415
1.133
30.993
26.8
Cd(ng/g)
指数
9.883
9.889
5.488
49.9
Cr(μg/g)
0.057
0.105
6.441
35.1
Cu(μg/g)
9.898
6.527
50.0
Hg(ng/g)
9.98
9.864
3.917
50.2
Ni(μg/g)
9.927
9.937
4.461
Pb(μg/g)
9.974
6.339
Zn(μg/g)
9.849
9.969
6.023
49.6
从表2可以看出,区域内As、Cr含量空间相关程度较高,这是因为As、Cr含量的空间分布是由结构性因素和随机性因素共同作用的结果.结构性因素(如母质、土壤类型、气候等成土因素)和随机性因素(如耕作、管理措施、种植制度、污染等人为活动的影响)削弱了As、Cr,尤其是As的空间相关性较强。
在研究区域内,铅(Pb)的块金值(C0)较大,说明铅(Pb)受随机因素和不确定因素的影响很大,铅(Pb)是一种不易迁移的重金属,局部污染会造成重金属的大量聚集。
另外,研究区重金属As的变程较大,为30.993km,说明As的含量主要与土壤母质有关,同时还受到一些随机因素的影响。
Cd,Cr,Cu,Hg,Ni,Pb,Zn的变程较小,说明它们受随机因素的影响较大,导致它们在较小的一个范围内存在相关关系。
(二)重金属元素的空间分布
根据地统计学原理,利用附件1,2提供的数据,使用MapGis软件做出8种重金属在该城区的空间分布图。
图5重金属元素As在该城区的空间分布图
图7重金属元素Cd在该城区的空间分布图
图8重金属元素Cr在该城区的空间分布图
图9重金属元素Cu在该城区的空间分布图
图10重金属元素Hg在该城区的空间分布图
图11重金属元素Ni在该城区的空间分布图
图12重金属元素Pb在该城区的空间分布图
图13重金属元素Zn在该城区的空间分布图
通过观察分析8种重金属在该城区的空间分布图,得到8种重金属污染源的统计信息,如表3所示:
表38种重金属污染源统计表
Cd
Cr
Cu
Hg
Zn
坐标
(5291,734)
(1385,334)
(19968,129)
(21439,113)
(10109,212)
(3573,601)
(2383,369)
(2708,229)
(14862,252)
(4741,643)
(5101,408)
(1647,372)
(19328,431)
(14207,998)
由表1中各重金属污染源的位置坐标可以看出污染源主要集中在工业区,交通区和生活区,也就是说这几个区域是重污染区。
由于交通区,工业区和生活区穿插,Cd、Hg、Pb、Zn在该城区的污染源出现两个,As在该城区的污染源出现三个,具体位置见表3。
从各重金属元素在该城区的空间分布图可以看出,8种重金属污染都在该城区主要工业区的邻近区域出现不同程度的污染,由此可以判断是由该城区的地质、气候、水流等因素所导致的。
五、模型分析
本文建立投影寻踪模型和地统计学模型对该地区土壤重金属污染情况进行空间变异分析和重金属污染评价。
一模型优点
投影寻踪模型(PP)能够将高维数据通过寻求最优投影方向映射到低维子空间,便于对样本进行综合评价,避免人为因素的干扰,解决了高维数据全局寻优的难题,大大减少了寻优工作量,可用于涉及多因素多样本的分类和综合评价分析。
采用地统计学模型方法对土壤进行重金属污染评价,利用单因子评价或综合评价的方法计算出土壤重金属的污染指数,进而计算出重金属的半变异函数,根据半变异函数的特点进行克里格插值,得到重金属污染指数分布图.它提供了一种由点数据向面数据转化的方式,根据重金属污染指数图可以清楚地看到土壤重金属的污染范围极其污染程,同时它还能对土壤重金属的污染方式进行预测.
二模型缺点
窗口密度R是投影寻踪模型唯一的参数,不同的R取值对应不同的最佳投影