一种分段曲线拟合方法研究.doc
《一种分段曲线拟合方法研究.doc》由会员分享,可在线阅读,更多相关《一种分段曲线拟合方法研究.doc(20页珍藏版)》请在冰点文库上搜索。
湖南人文科技学院毕业论文
一种分段曲线拟合方法研究
摘要:
分段曲线拟合是一种常用的数据处理方法,但在分段点处往往不能满足连续与光滑.针对这一问题,本文给出了一种能使分段点处连续的方法.该方法首先利用分段曲线拟合对数据进行处理;然后在相邻两段曲线采用两点三次Hermite插值的方法,构造一条连结两条分段曲线的插值曲线,从而使分段点处满足一阶连续.最后通过几个实例表明该方法简单、实用、效果较好.
关键词:
分段曲线拟合Hermite插值分段点连续
StudyonAMethodofSub-CurveFitting
Abstract:
Sub-curvefittingisacommonlyusedprocessingmethodofdata,butatsub-pointsitoftendoesnotmeetthecontinuationandsmooth,inallusiontotosolvethisproblem,thispaperpresentsawayformakingsub-pointmethodcontinuous.Firstly,thismethodofsub-curvefittingdealswiththedata;andthenusesthewayoftwopoints’cubicHermiteinterpolationintheadjacent,structuresainterpolationcurvethatlinksthetwosub-curves,sothesub-pointmeetsfirst-ordercontinuation;lastly,givesseveralexamplesshowsthatthismethodissimple,practicalandeffective.
Keywords:
sub-curvefittingHermiteinterpolationsub-pointcontinuous
前言
数据拟合是一种重要的数据处理方法,其中最常用的是多项式曲线拟合.然而当数据点较多时,多项式阶数太低,拟合精度和效果不太理想,要提高拟合精度和效果就需要提高曲线阶数,但阶数太高又带来计算上的复杂性及其他方面的不利.因此,如果只采用一种多项式曲线函数拟合较多的数据点,难以取得较好的拟合精度和效果.为有效地解决上述问题,一般采用分段曲线拟合.以往的分段曲线拟合方法主要是针对在自然科学领域中测量的数据而使用的拟合方法,这些数据的变化一般都遵循一定的规律.因此,在对这些测量数据拟合时,传统的分段曲线拟合方法一般是先根据主观经验对数据分段,然后进行拟合.但是对于有些实际问题的数据,比如社会、经济生活中的大量统计数据,这些数据变化的机理一般非常复杂,往往不像物理定律那样有着严格的规律,所以变化的不确定性很强.因此,传统的分段曲线拟合根据主观经验对数据进行分段的做法就显现出明显地不足.针对这种不足,国内外许多文献也讨论过,文献[1]研究的是最小二乘法在曲线拟合中的实现,给出了最小二乘法在多元正交基函数拟合中的计算机实现方法,以常见的二次曲线拟合为例说明了程序编制的要点,在实验的数据处理中具有实用价值;文献[2]讨论分段最小二乘曲线拟合方法,本文在一般最小二乘的基础上提出分段最小二乘曲线拟合的方案,讨论了连接分段拟合曲线的方法,并且给出分段最小二乘多项式拟合的计算方法;文献[4]主要介绍基于最小二乘原理的分段曲线拟合法,在最小二乘的基础上,运用实测数据点的分段曲线拟合法,探讨相应的模型以及用不同类型的曲线拟合同时拟合数据点的具体应用,对一实例,应用MATLAB编程设计,完成模型的求解、显著性检验等,可以得到拟合精度比较高的拟合曲线,该方法原理简便,其模型易用MATLAB编程求解;文献[5]研究的是基于最小二乘法的分段三次曲线拟合方法研究,多项式曲线拟合是一种较常用的数据处理方法,但当数据点较多时,只采用一种多项式曲线函数拟合所有数据点难以得到较好的拟合效果,针对传统分段曲线拟合方法中对数据点分段时经验成分较多的不足,提出了一种基于最小二乘法原理的分段三次曲线拟合方法,建立三次拟合曲线方程,通过实际数据的检验,验证了该方法的拟合效果;文献[6,7,8]主要研究基于分段三次曲线拟合的广州周发案量预测,随着城市化进程的不断加快,城市人口不断增多,广州市未来治安形势预警,支持政府部门和政法部门关于治安工作的决策,首先需要对未来时期的发案量做出比较精确的预测,由于目前广州市方案量统计数据比较少,且发案量受农历春节影响较明显,针对传统时间序列预测方法在此情况下应用不足,提出了基于分段三次曲线拟合的周发案量预测模型,并给出了具体的建模、计算步骤,最后通过实际数据的检验,证明了方法预测效果较好;文献[9]提出了分段函数的光滑方法及其在曲线拟合中的应用,在分析复杂实验数据时,采用分段曲线拟合方法,利用此方法在段内可以实现最佳逼近,但在段边界上却可能不满足连续性与可导性.
为了克服这种现象,本文主要研究一种能使段边界连续的方法,具有一定的理论和实际意义.在前人的基础上,本文总结分段曲线拟合的方法与步骤,介绍了分段三次曲线的拟合方法和两点三次Hermite插值,然后讨论如何利用Hermite插值方法使得分段拟合曲线在连接点处满足连续方法,最后通过一些实例应用,表明本文所介绍的方法具有一定的应用价值.
1最小二乘曲线拟合
1.1最小二乘法[1]
令待求的未知量为,它们可由个直接测量通过下列函数关系求得:
若为真值,由上述已知函数求出真值,若其测量值为,则对应的误差为.最小二乘法可定量表示为:
(1.1.1)
对不等精度的测量,应加上各测量值的权重因子,即:
(1.1.2)
最小二乘法是在随机误差为正态分布时,由最大似然法推出的这个结论.它可使测量误差的平方和最小,因此被视为从一组测量值中求出一组未知量的最可信赖的方法.
1.2最小二乘多项式曲线拟合的基本原理[2]
1.2.1线性拟合原理
将拟合函数取线性函数是一种简单的数据拟合方法,将数据点
确定线性拟合函数
(1.2.1.1)
称为对数据的线性拟合。
对于线性拟合问题,需要求函数
(1.2.1.2)
的最小值点,该问题的几何背景是寻求一条直线,使该直线与数据表所确定的平面散点的纵向距离的平方和最小,如图1.2.1-1所示.
0
x
y
(图1.2.1-1)
由函数对两个变量求导得:
(1.2.1.3)
(1.2.1.4)
其余等于零,得正规方程组
(1.2.1.5)
也可将其矩阵形式写出来即:
解得的值,将其代入(1.2.1.1)即可得到拟合线性函数.
1.2.2多项式拟合原理
为了确定数据拟合问题,选用幂函数作为函数类,则
(1.2.2.1)
这就是多项式拟合函数.
为了确定拟合函数的系数,需要求解正规方程组
(1.2.2.2)
也可以用矩阵形式表示为
解得即可,将其代入(1.2.2.1)即可得到拟合多项式.
2分段曲线拟合
2.1分段曲线拟合的基本原理[3]
先根据实测数据分布的特点,确定分段数目以及相应拟合曲线类型.拟合函数一般可选为多项式函数,因为在一定范围内,连续函数可用多项式任意逼近,然后再应用最小二乘法原理求得各分段拟合方程的系数.
基本步骤为:
第一步:
将数据点分段,确定基函数,
第二步:
根据题目要求,建立正规方程组,
第三步:
解正规方程组,求出待定系数,
第四步:
写出拟合函数.
下面以分段线性拟合与分段三次曲线拟合为例讨论分段拟合的基本过程.
2.1.1分段线性拟合
我们把给出的数据点分成组,即
其中为每组数据的个数.
首先考虑线性拟合这种简单的情形,对组数据点分别应用最小二乘线性拟合,得到各组数据点所对应的近似线性函数,
而在整个考虑的拟合区间上就得到了条直线段,现在就这条直线段所在各区间的左端点定义,该函数就成为整个区间上的数据拟合函数.这就是分段最小二乘线性拟合问题.
然而有些数据组并不是每段都呈线性关系,如数据,根据其散点图却发现其前个点较接近直线,后个点呈现非线性关系,则可分两段拟合.分别以一次多项式和次多项式进行拟合,即
(2.1.1.1)
为了说明具体的方法,不妨选的阶数为2,即
(2.1.1.2)
要保证在边界点连续光滑,所以存在两个约束条件
和,因此,式(2.1.1.1)和(2.1.1.2)的系数是相关的.解得,故式(2.1.1.1)为
令为最小二乘估计量,则
通过模型;,可求得最小方差的的值,从而确定出式(2.1.1.1)与(2.1.1.2)中的回归系数.最后,通过
和检验值,对回归方程进行显著性检验,式中;
;.
当然,根据不同的数据,可分三段进行拟合,或根据不同的数据特点,采用多次曲线拟合方式.
2.1.2分段三次曲线拟合[4,5]
设有个数据.因为四个数据点可确定一条三次曲线,但在选取分段点时,必须考虑分段后相邻曲线必须连续,即边界点连续,因此用五个数据点拟合一条三次曲线.
拟合方法:
首先对数据进行一定的分段,将第一到第五数据分为第一段,再将第五到第九个数据分为第二段,将第九到第十三个数据分为第三段,依次类推进行分组,即前一段末尾的数据为下一段数据的首位,这样便保证了数据分段的连续性.然后再对个分段数据进行三次曲线拟合即可.
令某段数据的三次拟合曲线函数为:
可以将此曲线函数分解为奇偶两个函数:
奇函数和偶函数.下面应用最小二乘法的基本原理求三次拟合曲线的系数[6],由于在每段数据中第一点和最后一点均两次参与拟合,因此,在求一段曲线的拟合方差时需要加权.按照平均分配的原则[7],求方差的权值,,得到该段曲线拟合的方差
(2.1.2.1)
曲线表示为奇偶函数的形式如下
(2.1.2.2)
由(2.1.2.2)可以推导出下式
(2.1.2.3)
令则
(2.1.2.4)
因此拟合方差为
(2.1.2.5)
即对的平滑可以看作是奇函数和偶函数分别平滑的叠加.从(2.1.2.5)式中可知奇函数拟合的方差.
(2.1.2.6)
令
解出
.
因此,即奇函数的拟合方差为0,达到最佳逼近.同样,从(2.1.2.5)式中可知偶函数拟合方差为
(2.1.2.7)
由(2.1.2.3)式得知在边界点上
.
考虑到边界点连续这一约束条件,令
(2.3.2.8)
因此由式(2.3.2.7)可令
(2.1.2.9)
解令,有,得
(2.1.2.10)
从(2.1.2.10)式可知三次曲线函数的系数的取值与边界点值有关,将(2.1.2.10)式代入(2.1.2.9)式中可得
.
所以得出,再令,有
解得
.(2.1.2.11)
联立式(2.1.2.8)、式(2.1.2.10)、式(2.1.2.11),解得
最后得到三次拟合曲线表达式为
.
3基于两点三次Hermite插值的分段曲线拟合
3.1插值的定义
定义3.1.1[9]设函数在区间上有定义,且已知在点
处的函数值,若存在次多项式
(3.1.1)
使得
(3.1.2)
成立,则称为的插值多项式,为插值结点,为插值函数.
3.2Hermite插值方法
Hermite插值方法可以处理插值条件中合导数值的插值问题,即知道插值结点处的函数值以及导数值,求插值多项式的插值问题.
3.2.1三次Hermite插值
考虑两个插值结点的情形,设,函数且已知
,
在区间上求三次插值函数
(3.2.1.1)
使其满足插值条件
.(3.2.1.2)
定理3.2.1.1[9]满足插值条件(3.2.1.2)的三次Hermite插值多项式是存在且唯一的.
证明:
由插值条件得线性方程组
(3.2.1.3)考虑系数矩阵行列式,利用行列式的拉普拉斯展开定理,可得
(3.2.1.4)
故系数矩阵非奇异,线性方程组(3.1.2.3)有唯一解,从而三次多项式存在且唯一.
例1求满足插值条件的三次插值多项式,以及满足插值条件的三次插值多项式.
解:
由于是三次多项式的二重零点,故可设
由插值条件得
,
求解得
代入
整理得
现求,由于是三次多项式的二重零点,是一重零点,故可设
由插值条件得
求解得
所以
注:
例题中的两个特殊的插值函数实际上是两点Hermite插值的基函数.
定理3.2.1.2[9]两点Hermite插值函数可以用基函数的方法表示为
,(3.2.1.5)
其中
注:
定理3.2.1.2中的为Hermite插值基函数,其中
;
例2给定,求Hermite插值多项式.
解:
.
显然本题不必计算.
3.3基于Hermite插值的分段曲线拟合基本原理的主要步骤
第一步:
根据给出的数据做出其散点图,
第二步:
分析散点图的特点,通过拟合试验确定分段拟合函数,
第三步:
采用MATLAB编程求得分段拟合函数的表达式,
第四步:
利用Hermite插值求出分段边界点的插值多项式,
第五步:
将插值多项式与分段拟合函数连接成连续的拟合曲线.
4实例应用
例3在农业生产试验研究中,对某地区土豆的产量与化肥的关系做了一实验,
得到磷肥的施肥量与土豆产量的对应关系如表4-1所示.
表4-1磷肥的施肥量与土豆产量的对应关系
磷施肥(公斤/公顷)
0
24
49
73
98
147
196
245
294
342
土豆产量(公斤)
33.46
32.47
36.06
37.96
41.04
40.09
41.26
42.17
40.36
42.73
根据上表的数据给出土豆产量与磷肥的关系做出其散点图,如图4-1所示.
图4-1磷肥的施肥量与土豆产量对应关系的散点图
从图可看出从0到98、从98到342之间分别呈明显的线性关系,由此可选取所求拟合函数为一分段的线性函数作拟合试验,换言之,用前5点作一线性拟合函数,再用后5个点也作一线性拟合函数.
采用MATLAB编程(见附录1)求得,对磷肥的分段拟合函数
分段拟合图如图4-2所示.
图4-2磷肥的施肥量与土豆产量分段拟合曲线图
考虑到边界点不连续,采用两点三次Hermite插值使边界点连续的方法,由于,故可以设其Hermite插值多项式为
经计算得
即
将插值多项式与分段边界点连接便可以得到连续的拟合曲线图,达到较好的拟合效果.拟合曲线图如图4-3所示(程序见附录2).
图4-3磷肥的施肥量与土豆产量的Hermite插值分段拟合曲线图
例4弹簧受力的作用伸长,与在一定范围内服从虎克定律:
(为弹性系数),呈线性关系;但当增加到一定值后,不再服从虎克定律.一次试验测得的数据如表4-2所示,其散点图如图4-4所示.
表4-2弹簧受力与伸长量的关系
(cm)
1
3
5
7
9
11
12
14
16
18
(N)
1.9
5.3
8.6
12.1
15.7
16.8
19.2
20.7
21.4
21.8
图4-4弹簧受力与伸长量的关系的散点图
通过散点图先拟合试验,得出前5个点可用线性拟合,后5个点可作二次函数拟合;同样采用分段拟合的方法,方法同例3(可设).运行程序(见附录3)可得.同样将拟合函数的边界点采用两点三次Hermite插值.
由,采用MATLAB编程(见附录4)求得插值多项式为
再用插值多项式连接分段拟合曲线的边界点便可得到较好的拟合图形,拟合曲线如图4-5所示(程序见附录5).
图4-5弹簧受力与伸长量的Hermite插值分段拟合曲线图
例5在油页高温分解的过程中,一种苯有机分解成沥青及其他物质,要了解沥青在一定温度下随时间(分钟)变化的相对浓度(%)之间的关系.试验如表4-3所示,散点图如图4-6所示.
表4-3沥青的相对浓度与时间变化的关系
5
15
20
50
65
80
100
120
160
180
0
8.0
15.1
20.1
20.5
22.0
20.9
18.2
11.5
5.5
图4-6沥青的相对浓度与时间变化的关系的散点图
同样通过散点图先作拟合试验,得出前5个点可采用三次多项式拟合,后5个点可采用二次多项式拟合,可设分段拟合函数为
运行程序(见附录6)得出
再将拟合函数的边界点采用两点三次Hermite插值,由
采用MATLAB编程(见附录7)计算求得插值多项式为
将插值多项式连接分段拟合曲线的边界点后得到的拟合曲线图,拟合曲线见图4-7(程序见附录8).
图4-7沥青的相对浓度与时间变化的关系的Hermite插值分段拟合图
5结束语
本文介绍最小二乘多项式曲线拟合的基本原理,在具体介绍线性拟合、多项式拟合的基本及方法的基础上,给出了分段曲线拟合的方法与步骤.分段曲线拟合是一种常用的数据处理方法,但是在分段点处往往不能满足连续与光滑,针对这一问题,本文进一步给出了Hermite插值的基本原理,并采用两点三次Hermite插值连接分段曲线,从而使分段点处满足一阶连续,最后通过三个实例表明该方法的拟合效果较好.
另外,本文仅讨论了使用Hermite插值连接分段线性、分段多项式曲线拟合的方法,对其他种类的曲线未作讨论.事实上,两点三次Hermite插值的方法连接其他种类的拟合曲线同样适用.
参考文献
[1]聂翔,张瑞林.最小二乘法在曲线拟合中的实现[J].陕西工学院学报,2000,3:
79-82.
[2]张东林.分段最小二乘曲线拟合[J].沈阳大学学报(自然科学版),1994,2:
80-83.
[3]刘晓莉,陈春梅.基于最小二乘原理的分段曲线拟合法[J].伊犁教育学院学报,2004,17(3):
131-136.
[4]蔡山,张浩,陈洪辉,等.基于最小二乘法的分段三次曲线拟合方法研究[J].科学技术与工程,2007,7(3):
352-355.
[5]张浩,任义广,沙基昌.基于分段三次曲线拟合的广州周发案量预测[J].计算机仿真,2008,25(6):
257-260.
[6]RoychowdhuryS.Fuzzycurvefittingusingleastsquareprinciples[J].IEEEInternationalConferenceonSystems,ManandCybemetics,1998,4:
4022-4027.
[7]高伟,姜水生.分段曲线拟合与离散度加权的数据误差处理方法[J].中国测试技术,2005,11:
55-56.
[8]张兴元.分段函数的光滑方法及其在曲线拟合中的应用[J].西南民族大学学报(自然科学版),2007,33(3):
486-490.
[9]钟尔杰,黄延祝.数值分析(第四版)[M].北京:
高等教育出版社,2004.
[10]韩中庚.数学建模方法及其应用[M].北京:
高等教育出版社,2005.
[11]刘卫国.MATLAB程序设计与应用(第二版)[M].北京:
高等教育出版社,2006.
致谢
经过几个月的努力和忙碌,本次毕业论文即将完成,对为一个本科生的毕业论文,由于经验不足,难免有许多地方考虑不全面,如果没有指导老师的督促与辛勤的指导,以及一起学习的同学们的帮助与支持,想顺利的完成这篇论文比较难.
值此论文完成之际,首先对指导老师李军成老师表示最诚挚的感谢与崇高的敬意.李老师严谨的治学态度,深厚渊博的学术素养,敏锐的思维,积极进去的精神,严以律己,宽以待人的崇高品质,乐观向上的人生态度,谦逊和蔼的为人品德,平等的师生关系,尤其是认真负责的工作态度均给我留下了不可磨灭的印象,相信对我今后的学习、工作以及生活都会有着深远的影响.
感谢陈国华主任、杨笃庆书记、谭本远主任等数学系领导们,你们认真负责的治学态度和高速度、高效率的办事方式深深的感染了我们,让我们能够时时刻刻提醒自己要认真负责对待每件事情、每一个环节,感谢梁经珑老师、杨涤尘老师、余星老师、李军成老师、邓华老师、钟月娥老师、孙红果老