数学建模模拟题图论回归模型聚类分析因子分析等 70.docx
《数学建模模拟题图论回归模型聚类分析因子分析等 70.docx》由会员分享,可在线阅读,更多相关《数学建模模拟题图论回归模型聚类分析因子分析等 70.docx(9页珍藏版)》请在冰点文库上搜索。
数学建模模拟题图论回归模型聚类分析因子分析等70
(题目)
摘要
关键词:
Ⅰ问题重述
一矿脉有13个相邻样本点,人为地设定一原点,现测得各样本点对原点的距离x,与该样本点处某种金属含量y的一组数据如表14,画出散点图观测二者的关系,试建立合适的回归模型,如二次曲线、双曲线、对数曲线等。
Ⅱ问题分析
本问题中没有给出明确的模型选择,我们先画出其散点图,然后对其分析,建立模型。
从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些系数,只是它们的一个(点)估计,应该对它们作区间估计或假设检验,如果置信区间太大,甚至包含了零点,那么系数的估计值是没有多大意义的。
另外也可以用方差分析方法对模型的误差进行分析,对拟合的优劣给出评价。
Ⅲ模型假设
回归分析在一组数据的基础上研究这样几个问题:
(i)建立因变量与自变量
…
之间的回归模型;
(ii)对回归模型的可信度进行检验;
(iii)判断每个自变量对y的影响是否显著;
(iv)诊断回归模型是否适合这组数据;
(v)利用回归模型对y进行预报或控制。
Ⅳ符号说明
Ⅴ模型建立
Matlab统计工具箱用命令regress实现多元线性回归,用的方法是最小二乘法,用法是:
其中
是按照
,
式排列的数据
为回归系数估计值为
通过码头MATLAB来建立回归模型。
这里
同上,
为显著性水平(缺省时设定为0.05),
为回归系数估计值和它们的置信区间,,
为残差(向量)及其置信区间,
是用于检验回归模型的统计量。
Ⅵ模型求解
1.散点图模型的求解
输入程序及题目数据,绘出散点图:
图1
从图像上看,如果第一个点数据剔除,线性关系比较明显,但并不能排除其他模型。
下面就对几种模型都加以计算比较。
(程序见附录1)
2.线性模型
输入程序得到下图,程序见附录2
图2
结果输出:
b=108.25810.1742
Bint=107.2794109.23670.08910.2593
stats=0.648420.28660.0009
线性相关系数较小,线性回归模型在alpha>0.0009成立第一个点为异常点(仅指线性模型下),予以剔除。
结果输出:
b=109.06680.1159
bint=108.8264109.30720.09580.1360
stats=0.9428164.80600.0000
剔除第一个点后线性系数和p值都变得好了很多。
没有异常点。
线性模型为:
对该模型求剩余标准差:
得:
rmse=0.1635
3.二次曲线
考虑第一个点偏离太多,剔除后重新输入程序计算可得:
p=-0.00430.2102108.6718
二次模型
对该模型求剩余标准差:
[Y,delta]=polyconf(p,x,S);
rmse=sqrt(sum((y-Y).^2)./10),得:
rmse=0.1231
程序见附录3
双曲线模型
双曲线模型类似于
,可以通过将x的倒数代换转化为线性模型来求。
输入程序得到图4,程序见附录4。
输出结果:
b=111.4405-9.0300
bint=111.1068111.7743-10.6711-7.3889
stats=0.9302146.67330.0000
有两个异常点,剔除后再次输入程序可得图(3.5),程序见附录3.6
输出结果:
b=111.5653-10.9938
bint=111.2882111.8424-13.5873-8.4002
stats=0.9309107.76230.0000
结果比较
通过对几个模型的比较可得,二次模型的剩余标准差最小。
不过几个模型的差别很小
Ⅶ模型评价与改进
通过对几个模型的比较可得,二次模型的剩余标准差最小。
不过几个模型的差别很小。
固采用二次模型为最合适模型
参考文献
[编号]作者,书名,出版地:
出版社,出版年。
[编号]作者,论文名,杂志名,卷期号:
起止页码,出版年。
[编号]作者,资源标题,网址,访问时间(年月日)。
附录1
alpha=0.05;
x1=[23457810111415151819]';
y=[106.42109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20]';
x=[ones(13,1),x1];
[b,bint,r,rint,stats]=regress(y,x,alpha);
b,bint,stats,rcoplot(r,rint)
附录二
alpha=0.05;
x1=[23457810111415151819]';
y=[106.42109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20]';
x=[ones(13,1),x1];
[b,bint,r,rint,stats]=regress(y,x,alpha);
b,bint,stats,rcoplot(r,rint)
附录三
alpha=0.05;
x1=[3457810111415151819]';
y=[109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20]';
x=[ones(12,1),x1];
[b,bint,r,rint,stats]=regress(y,x,alpha);
b,bint,stats,rcoplot(r,rint)
附录四
x=[3457810111415151819];
y=[109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20];
[p,S]=polyfit(x,y,2);p