杨虎实验设计论文 4.docx

上传人:b****8 文档编号:12875238 上传时间:2023-06-08 格式:DOCX 页数:25 大小:265.55KB
下载 相关 举报
杨虎实验设计论文 4.docx_第1页
第1页 / 共25页
杨虎实验设计论文 4.docx_第2页
第2页 / 共25页
杨虎实验设计论文 4.docx_第3页
第3页 / 共25页
杨虎实验设计论文 4.docx_第4页
第4页 / 共25页
杨虎实验设计论文 4.docx_第5页
第5页 / 共25页
杨虎实验设计论文 4.docx_第6页
第6页 / 共25页
杨虎实验设计论文 4.docx_第7页
第7页 / 共25页
杨虎实验设计论文 4.docx_第8页
第8页 / 共25页
杨虎实验设计论文 4.docx_第9页
第9页 / 共25页
杨虎实验设计论文 4.docx_第10页
第10页 / 共25页
杨虎实验设计论文 4.docx_第11页
第11页 / 共25页
杨虎实验设计论文 4.docx_第12页
第12页 / 共25页
杨虎实验设计论文 4.docx_第13页
第13页 / 共25页
杨虎实验设计论文 4.docx_第14页
第14页 / 共25页
杨虎实验设计论文 4.docx_第15页
第15页 / 共25页
杨虎实验设计论文 4.docx_第16页
第16页 / 共25页
杨虎实验设计论文 4.docx_第17页
第17页 / 共25页
杨虎实验设计论文 4.docx_第18页
第18页 / 共25页
杨虎实验设计论文 4.docx_第19页
第19页 / 共25页
杨虎实验设计论文 4.docx_第20页
第20页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

杨虎实验设计论文 4.docx

《杨虎实验设计论文 4.docx》由会员分享,可在线阅读,更多相关《杨虎实验设计论文 4.docx(25页珍藏版)》请在冰点文库上搜索。

杨虎实验设计论文 4.docx

杨虎实验设计论文4

本科课程设计(论文)

 

论文题目:

实验设计与住房规模统计分析

课程名称:

实验设计

学院:

理学院

专业:

统计学

年级:

09级

姓名:

杨虎

学号:

0907010233

指导教师:

胡尧

11年12月28日

 

成绩

 

 

 

年月日

 

目录

 

第一部分内容提要…………………………………………………………(4)

第二部分定义与模型假设…………………………………………(4)

第三部分数据方差分析…………………………………………………(5)

第四部分回归方法求解………………………………………………(10)

第五部分检验求解过程………………………………………………(17)

第六部分对模型的评价…………………………………………………(19)

第七部分参考文献………………………………………………………(20)

第八部分附录……………………………………………………………(20)

 

住房规模统计数据的实验分析

一,内容提要

此分析是根据采集到的与住房保障规模有关的统计指标数据分析,运用实验设计方法中的方差分析,多重比较,数据拟合,多项式拟合,及回归思想,分析析y与x1,x2,x3,x4,x5,的关系,再根据多元统计方法,从全局的角度对y与x1,x2,x3,x4,x5,总体关系,比较各个模型所建立的回归估计与真实数据的拟合程度得到最佳数学模型。

定义变量

分别代表;(为了程序方便

我们用x1,x2,…代替)x1城镇居民家庭可支配收入x2商品房平均销售价格(千元)x3人均住宅消费性支出x4城镇居民家庭恩格尔系数x5国家财政收入(亿元)y保障房与当年新开工房屋面积比:

二,数据采集及问题的提出

下面已有数据为全国各年住房保障数据及统计指标

 

年份

城镇居民家庭可支配收入

X1

商品房平均销售价格(千元)

X2

人均住宅消费性支出

X3

城镇居民家庭恩格尔系数%

X4

国家财政收入(亿元)

X5

保障房与当年新开工房屋面积比y

1997

5160.30

1.997

358.64

46.6

8651.14

12.2661

1998

5425.10

2.063

408.39

44.7

9875.95

17.0022

1999

5854.02

2.053

453.99

42.1

11444.08

17.5840

2000

6280.00

2.112

565.29

39.4

13395.23

17.9609

2001

6859.60

2.17

547.96

38.2

16386.04

15.4997

2002

7702.80

2.25

624.36

37.7

18903.64

12.3356

2003

8472.20

2.359

699.38

37.1

21715.25

9.7438

2004

9421.60

2.778

733.53

37.7

26396.47

7.0472

2005

10493.00

3.168

808.66

36.70

31649.29

5.1619

2006

11759.50

3.367

904.19

35.80

38760.2

5.5254

2007

13785.80

3.864

982.28

36.29

51321.78

5.0421

2008

15780.76

3.8

1145.40

37.89

61330.35

5.4819

2009

17174.65

4.681

1229.00

36.52

68518.3

4.5993

1.对有关统计数据进行分析,寻找影响城镇住房保障规模规模的主要因素或指标。

2.建立城镇住房保障规模与上述主要因素或指标之间联系的数学模型。

3.利用所建立的关于城镇住房保障规模的数学模型,根据有关政策和规划对未来几年我国和我省住房保障规模的趋势进行仿真(可以根据模型的需要对未来的情况作适当的假设)。

 

二、数据变量定义符号定义模型假设

1,这里主要考虑理想因素,忽略某些随机干扰细微因子影响

2.住房需求量受到实际房价和理想房价的影响。

实际价格与理想价格的比值越大,需求量越少;反之,实际价格与理想价格的比值越小,需求量越多;

3.住房供应量受到地产商预测的房价和理想房价的影响。

预测价格与理想价格的比值越大,供应量越多;反之,预测价格与理想价格的比值越小,供应量越少;

4供需平衡指:

供应量=需求量;

5,变量

分别代表;(为了程序方便

我们用x1,x2,…代替)x1城镇居民家庭可支配收入x2商品房平均销售价格(千元)x3人均住宅消费性支出x4城镇居民家庭恩格尔系数x5国家财政收入(亿元)y保障房与当年新开工房屋面积比

三,用实验设计方法对统计数据进行检验与分析

1对数据进行正态性检验

[X,textdata]=xlsread('book1.xls');%读取数据

X=X(:

2:

end);%提取要分析数据,所有行2至最后一列

A=X(:

1);%提取X数据的第一列

B=X(:

2);%提取X数据的第二列

C=X(:

3);%提取X数据的第三列

D=X(:

4);%提取X数据的第四列

E=X(:

5);%提取X数据的第五列

data=[A',B',C',D',E']';%将要分析数据转换成一列矩阵

group=strcat({'N'},num2str([ones(13,1);2*ones(13,1);3*ones(13,1);4*ones(13,1);5*ones(13,1)]))';%定义元胞数组以Xi进行分组

[h1,p1]=lillietest(data,0.01)%由于量纲不同造成不是正态

Warning:

Pislessthanthesmallesttabulatedvalue,returning0.001.

>Inlillietestat170

h1=

1

p1=

1.0000e-003

检验结果分析:

由于量纲不同造成不是正态

2对数据做方差齐次性检验

[p,stats]=vartestn(data,group)

p=

0

stats=

chisqstat:

480.9389

df:

4

检验结果分析:

数据的方差齐次性检验未通过

3,数据标准化后做方差分析

[X,textdata]=xlsread('book1.xls');%读取数据

X=X(:

2:

end);%提取要分析数据,所有行2至最后一列

A=X(:

1);%提取X数据的第一列

B=X(:

2);%提取X数据的第二列

C=X(:

3);%提取X数据的第三列

D=X(:

4);%提取X数据的第四列

E=X(:

5);%提取X数据的第五列

data=[A',B',C',D',E']';%将要分析数据转换成一列矩阵

group=strcat({'N'},num2str([ones(13,1);2*ones(13,1);3*ones(13,1);4*ones(13,1);5*ones(13,1)]))';%定义元胞数组以Xi进行分组

data1=zscore(data);%将数据进行标准化

[p1,table,stats2]=anova1(data1,group)

p1=

5.8270e-012

table=

'Source''SS''df''MS''F''Prob>F'

'Groups'[39.5278][4][9.8820][24.2283][5.8270e-012]

'Error'[24.4722][60][0.4079][][]

'Total'[64][64][][][]

stats2=

gnames:

{5x1cell}

n:

[1313131313]

source:

'anova1'

means:

[0.1160-0.5485-0.4980-0.54601.4765]

df:

60

s:

0.6386

检验结果分析:

方差分析(anova1函数)返回的p值为0(

计量值为[5.8270e-012];故拒绝原假设,认为不同的统计指标对城镇住房保障规模有显著的差别,其中各个指标标准化后均值为【[0.1160-0.5485-0.4980-0.54601.4765]】在上述否定原假设情况下,继续估计各路段总体均值的1-alpha

(95%)置信区间:

调用方差分析和各水平均值mu的1-alpha的置信区间公式(文献即《概率论与数理统计教程》茆诗松等高等教育出版社教材P377)

muhat=[0.1160-0.5485-0.4980-0.54601.4765];

sigmahat=0.6386;

mi=[1313131313];

fori=1:

5

muci_L(i)=muhat(i)-sigmahat*tinv(0.975,60)/sqrt(mi(i))

muci_L=

-0.2383

muci_U(i)=muhat(i)+sigmahat*tinv(0.975,60)/sqrt(mi(i))%

muci_U=

0.4703

c1=multcompare(stats2)%对数据进行多重比较根据结构变量体stats1中的信息进行多重比较,返回两两比较的结果矩阵

c1=

1.00002.0000-0.04010.66451.3690

1.00003.0000-0.09050.61401.3185

1.00004.0000-0.04260.66191.3665

1.00005.0000-2.0651-1.3606-0.6561

2.00003.0000-0.7550-0.05040.6541

2.00004.0000-0.7070-0.00250.7020

2.00005.0000-2.7295-2.0250-1.3205

3.00004.0000-0.65660.04790.7524

3.00005.0000-2.6791-1.9746-1.2701

4.00005.0000-2.7270-2.0225-1.3180

结果分析:

由此可见,在显著水平alpha=0.05下,5个指标在均值之间有显著性差异

四,用回归方法作相关性分析及拟合数据(求解回归模型)

1,首先用matlab做相关性分析找主要因子

>>[X,textdata]=xlsread('book1.xls');

>>X=X(:

2:

end);%提取数据2到最后一列,即是要分析数据

>>varname=textdata(1,2:

end);%提取第1行,2至最后一列,即变量名

>>obsname=textdata(1:

end,2);%提取第一列,即年份

>>[r,p]=corrcoef(X)

r=

1.00000.98130.9913-0.67040.9974-0.8497

0.98131.00000.9621-0.61990.9816-0.8462

0.99130.96211.0000-0.74580.9825-0.8423

-0.6704-0.6199-0.74581.0000-0.62980.6427

0.99740.98160.9825-0.62981.0000-0.8213

-0.8497-0.8462-0.84230.6427-0.82131.0000

p=

1.00000.00000.00000.01210.00000.0002

0.00001.00000.00000.02380.00000.0003

0.00000.00001.00000.00340.00000.0003

0.01210.02380.00341.00000.02110.0178

0.00000.00000.00000.02111.00000.0006

0.00020.00030.00030.01780.00061.0000

从相关系数矩阵r可以看出,y与x1最为相关,而x1表示城镇居民家庭可支配收入,符合预想,其它变量相关程度为,x2,x3,x5,x4,这是我们对统计数据的初步分析,并没有考虑交叉项等的影响,下面我们对逐一变量

进行分析

2,数据拟合

首先在我们不知道建立什么模型是通常都设模型的基本形式为

(1)

然后根据数据逐个数据拟合再迭加每个模型得到最初模型,再寻求改进方法

我们用因变量y(即保障房规模比例)与年份做图,可以看出我国近年来住房保障规模(即保障房与当年新开工房屋面积比)的大致走向。

从图形中可以看出大致趋势,保障规模先大量增加,后回落并定于5%左右,反映出来国家对保障住房规模的探索,也说明了保障住房规模不那么容易确定。

住房保障的主要目的是保证中低收入家庭的基本居住需要。

住房保障水平的高低主要取决于基本居住水平标准、住宅存量规模与人口规模的关系、中低收入家庭

matlab程序试触

用多项式拟合

程序

x=[…];

y=[…];

A=polyfit(x,y,m)

z=polyval(A,x);

plot(x,y,'k+',x,z,'r')%作出数据点和拟合曲线的图形

 

对x1时m=2拟合比较好

 

为此我们可以得到y与x1的初模型

(2)

对于x2,程序中m取4时拟合比较接近,说明y与x2关系可以用一个4次多项式拟

所以我们设计初模型

(3)

x=[…];

y=[…];

A=polyfit(x,y,5)%多项式拟合

z=polyval(A,x);%x点的值

plot(x,y,'k+',x,z,'r')

对于x3当m=5时得到如下拟合图像,我们用5次式去拟合

x3时m=5x4时m=2

x5时m=2

根据数据与图关系

 

得到y与x3的初模型为

(4)

对于x4当m=5时得到如下拟合图像,我们用5次式去拟合

得到y与x4的初模型为

(5)

对于x5当m=2时得到如下拟合图像,拟合效果比较好,我们用2次式去拟合

得到y与x5的初模型为

(6)

根据以上分析,我们可以迭加模型

(2)~(6)得到y的初步模型

得到很复杂的模型,对于次模型由于参数复杂,并且用线性方程组求解估计其参数比较烦,我们可以寻求比较简单且容易看懂的模型求解,现在我们对各变量进行逐步回归,将非线性模型转化为标准理想模型

并估计模型中未知系数,并进行检验分析

用matlab逐步回归实现

matlab

命令程序为

>>x1=[5.160305.425105.854026.280006.859607.702808.472209.4216010.4930011.7595013.7858015.7807617.13465];

>>x2=[1.9972.0632.0532.1122.172.252.3592.7783.1683.3673.8643.84.681];

>>x3=[358.64408.39453.99565.29547.96624.36699.38733.53808.66904.19982.281145.401229.00];

>>x4=[46.644.742.139.438.237.737.137.736.7035.8036.2937.8936.52];

>>x5=[8.651149.8759511.4440813.3952316.3860418.9036421.7152526.3964731.6492938.760251.3217861.3303568.5183];

>>y=[12.266117.002217.584017.960915.499712.33569.74387.04725.16195.52545.04215.48194.5993];

>>A=[x1'x2'x3'x4'x5'];

>>Stepwise(A,y')%逐步回归

从图中虽然觉得我们应该movex4out即可以剔除新,但是逐步回归有时会将一些看似没有关系但实际上比较重要的数据删掉像x2的相关性也比较弱,然用[b,bint,r,rint,stats]=regress(y',A,0.05)得到F检验为0.9500,因此再进一步验证,

现在我们对x1~x5做线性回归

matlab

命令程序为

>>X=[ones(13,1)x1'x2'x3'x4'x5'];

>>b=regress(y',X)

b=

68.5628

-16.0564

-1.3619

0.0510

-0.1503

2.3281

得模型

(7)

以上为全变量模型,现在我们movex4out对x1,x2,x3,x5做线性回归

>>X=[ones(13,1)x1'x2'x3'x5'];

>>b=regress(y',X)

 

b=

59.7372

-16.0746

-1.1976

0.0579

2.2480

删除x4后得到的模型为

(8)

现在我们采用多元二项式回归确定是否需要变量x4

用[b,bint,r,rint,stats]=regress(y',A,0.05)

rstool(A,y','purequadratic')

matlab程序试触

>>A=[ones(13,1)x1'x2'x3'x4'x5'];

[b,bint,r,rint,stats]=regress(y',A,0.05)

b=

68.5628

-16.0564

-1.3619

0.0510

-0.1503

2.3281

 

bint=

18.7112118.4145

-22.9938-9.1190

-7.9221-5.1983

0.00280.1048

-0.95360.6530

1.33343.3228

 

r=

-2.1395

1.2653

2.3546

-0.9700

-0.3057

0.3473

-0.2021

0.3671

0.0069

-0.5826

-1.0050

0.0046

0.8591

 

stats=

0.954829.57800.00012.1629

得到模型

(9)

(8)(9)式相比,显然逐步回归与[b,bint,r,rint,stats]=regress(y',A,0.05)检验结果是很显著的stats=0.9548在显著水平下是远远合理的,但是本模型仍然存在问题,原因是

参数估计的置信区间为[-0.95360.6530],这个区间包含有0元素,我们一般的模型假设检验都是设

,但是

的取值有可能为0,这是模型存在可改进的地方之一,但是我们前面的模型假设当中,假设只考虑理想因素,可以忽略某些个别不重要因子,由于在前面的相关性分析之中我们知道

与因变量y的相关性最弱所以,只要检验通过,我们可以忽略

置信区间的影响。

所以模型

即为所求

 

(五)对回归模型的检验与验证

(解决问题)一个模型建立是否合理,要看能否解决当前的实际问题,现在我们将上面得到的保障房规模模型对当前某省的情况进行检测,希望可以得到我们模型的准确性

某省住房保障模规模比例数据

年份

X1

X2

X3

X4

X5

y

Y估计

2005

6.85

2.22

590.27

43.7

6.565525

2.244988

31.64839

2006

8.47

2.322

694.17

42.40

8.16512

3.548913

43.44825

2007

9.42

2.63

850.24

39.70

10.34725

2.305725

57.80356

2008

12.99

2.949

988.12

41.00

13.26047

3.469705

68.92819

2009

14.09

2.893

988.12

39.60

15.51256

3.210836

69.88693

根据以上介绍我们同样采用逐步回归和[b,bint,r,rint,stats]=regress(y',A,0.05)命令求解

y=-0.5136-0.3163x1-10.9299x2+0.0525x3-0.3294x4+0.4923x5

图一(全国保障房规模数据图)

图二(某省保障房规模数据图)

(对比图像我们看出图二与图一的2004年后图像相近)

此模型与我们所建模型,完全不符,这是因为时间推移造成的影响,图像也给出证明,但是我们的建模设计过程是通过逐步迭加,这是没有错误的,

联系当前我国房价统计情况,在1996~2009年间,正处于城镇住房保障的形式和快速发展阶段,相关性分析也做出表明,说明住房呈现供不应求的局面,人均可支配收入的增加,商品房价格也在增加,由图例根据我们的模型可预测我国的住房保障规模大致稳定在5%左右,并且建议我国的住房保障规模应维持现状,这样才符合当前需要

 

六、对分析的评价与改进

一、统计分析与模型的优点:

1.此分析与模型层层替推,之间的逻辑清晰,便于理解,更易实用;

2.模型考虑的比较全面,运用此模型可以十分准确地推测各因素对房地产产业的发展影响比重;

3.模型更加具体,分析的结果更适合实际情况;

二、统计分析与模型的缺点:

1,数据检验时由于受到量纲不同的到的检验有些并没有通过

2.前期准备时所需数据量不容易收集,而且处理数据时容易出错;

2.模型中用到的一些数据会是人的一些经验所得,所以会有一定的误差;

3.由于在建立模型时不能考虑到所有的影响因素,必须忽略一些次要因素,所以只能大概的反映城镇居民住房的保障情况。

三,分析模型可以改进之处

上面我们已经提到

参数估计的置信区间为[-0.95360.6530],这个区间包含有0元素,我们一般的模型假设检验都是设

,但是

的取值有可能为0,这是模型存在可改进的地方之一,我们可以考虑剔除变量,即在逐步回归中去掉次变量,或引入某些变量。

方差分析中可以采用马氏距离

 

参考文献

@标准车流数据的处理胡尧

(1)多元统计分析张润

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2