数学建模模拟题图论回归模型聚类分析因子分析等 70.docx

资源描述

数学建模模拟题图论回归模型聚类分析因子分析等 70.docx

《数学建模模拟题图论回归模型聚类分析因子分析等 70.docx》由会员分享，可在线阅读，更多相关《数学建模模拟题图论回归模型聚类分析因子分析等 70.docx（9页珍藏版）》请在冰点文库上搜索。

数学建模模拟题图论回归模型聚类分析因子分析等 70.docx

数学建模模拟题图论回归模型聚类分析因子分析等70

（题目）

摘要

关键词：

Ⅰ问题重述

一矿脉有13个相邻样本点，人为地设定一原点，现测得各样本点对原点的距离x，与该样本点处某种金属含量y的一组数据如表14，画出散点图观测二者的关系，试建立合适的回归模型，如二次曲线、双曲线、对数曲线等。

Ⅱ问题分析

本问题中没有给出明确的模型选择，我们先画出其散点图，然后对其分析，建立模型。

从数理统计的观点看，这里涉及的都是随机变量，我们根据一个样本计算出的那些系数，只是它们的一个（点）估计，应该对它们作区间估计或假设检验，如果置信区间太大，甚至包含了零点，那么系数的估计值是没有多大意义的。

另外也可以用方差分析方法对模型的误差进行分析，对拟合的优劣给出评价。

Ⅲ模型假设

回归分析在一组数据的基础上研究这样几个问题：

（i）建立因变量与自变量

…

之间的回归模型；

（ii）对回归模型的可信度进行检验；

（iii）判断每个自变量对y的影响是否显著；

（iv）诊断回归模型是否适合这组数据；

（v）利用回归模型对y进行预报或控制。

Ⅳ符号说明

Ⅴ模型建立

Matlab统计工具箱用命令regress实现多元线性回归，用的方法是最小二乘法，用法是：

其中

是按照

，

式排列的数据

为回归系数估计值为

通过码头MATLAB来建立回归模型。

这里

同上，

为显著性水平（缺省时设定为0.05），

为回归系数估计值和它们的置信区间，,

为残差（向量）及其置信区间，

是用于检验回归模型的统计量。

Ⅵ模型求解

1.散点图模型的求解

输入程序及题目数据，绘出散点图：

图1

从图像上看，如果第一个点数据剔除，线性关系比较明显，但并不能排除其他模型。

下面就对几种模型都加以计算比较。

（程序见附录1）

2.线性模型

输入程序得到下图，程序见附录2

图2

结果输出：

b=108.25810.1742

Bint=107.2794109.23670.08910.2593

stats=0.648420.28660.0009

线性相关系数较小，线性回归模型在alpha>0.0009成立第一个点为异常点（仅指线性模型下），予以剔除。

结果输出：

b=109.06680.1159

bint=108.8264109.30720.09580.1360

stats=0.9428164.80600.0000

　　剔除第一个点后线性系数和p值都变得好了很多。

没有异常点。

　　线性模型为：

对该模型求剩余标准差：

得：

rmse=0.1635

3.二次曲线

考虑第一个点偏离太多，剔除后重新输入程序计算可得：

p=-0.00430.2102108.6718

二次模型

对该模型求剩余标准差：

[Y,delta]=polyconf（p,x,S）;

rmse=sqrt（sum（（y-Y）.^2）./10）,得：

rmse=0.1231

程序见附录3

双曲线模型

双曲线模型类似于

，可以通过将x的倒数代换转化为线性模型来求。

输入程序得到图4,程序见附录4。

输出结果：

b=111.4405-9.0300

bint=111.1068111.7743-10.6711-7.3889

stats=0.9302146.67330.0000

有两个异常点，剔除后再次输入程序可得图（3.5），程序见附录3.6

输出结果：

b=111.5653-10.9938

bint=111.2882111.8424-13.5873-8.4002

stats=0.9309107.76230.0000

结果比较

通过对几个模型的比较可得，二次模型的剩余标准差最小。

不过几个模型的差别很小

Ⅶ模型评价与改进

通过对几个模型的比较可得，二次模型的剩余标准差最小。

不过几个模型的差别很小。

固采用二次模型为最合适模型

参考文献

[编号]作者，书名，出版地：

出版社，出版年。

[编号]作者，论文名，杂志名，卷期号：

起止页码，出版年。

[编号]作者，资源标题，网址，访问时间（年月日）。

附录1

alpha=0.05;

x1=[23457810111415151819]';

y=[106.42109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20]';

x=[ones（13,1）,x1];

[b,bint,r,rint,stats]=regress（y,x,alpha）;

b,bint,stats,rcoplot（r,rint）

附录二

alpha=0.05;

x1=[23457810111415151819]';

y=[106.42109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20]';

x=[ones（13,1）,x1];

[b,bint,r,rint,stats]=regress（y,x,alpha）;

b,bint,stats,rcoplot（r,rint）

附录三

alpha=0.05;

x1=[3457810111415151819]';

y=[109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20]';

x=[ones（12,1）,x1];

[b,bint,r,rint,stats]=regress（y,x,alpha）;

b,bint,stats,rcoplot（r,rint）

附录四

x=[3457810111415151819];

y=[109.20109.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20];

[p,S]=polyfit（x,y,2）;p

展开阅读全文