房地产业发展问题.docx
《房地产业发展问题.docx》由会员分享,可在线阅读,更多相关《房地产业发展问题.docx(23页珍藏版)》请在冰点文库上搜索。
2009高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
华南理工大学
参赛队员(打印并签名):
1.张蕾蕾
2.辜质敏
3.姚嘉亮
指导教师或指导教师组负责人(打印并签名):
刘青
日期:
2009年9月8日
赛区评阅编号(由赛区组委会评阅前进行编号):
2009高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
房地产业发展问题
摘要
住房问题是关系民生的大问题,而房地产业健康稳定发展也是作为建设小康社会的一项重要指标。
本文根据已给数据建立了有关房地产市场发展的数学模型,研究了房地产市场发展与经济发展的关系以及影响房地产业发展的因素。
在处理问题一时,我们首先确定了能够反映经济发展的7个重要指标,并将房地产市场发展与经济发展的关系转化为房地产开发投资与这7项指标之间的关系。
对数据进行了初步的处理,然后建立逐步回归模型,通过SPSS对数据进一步进行处理求出回归系数的到最后的回归模型为Y=12.557+0.133∙X1-0.07∙X2-0.017∙X6。
结果表明房地产业发展与经济发展成正相关,房地产的发展对经济有一定的促进作用。
利用线性拟合对2009年该市的房地产市场发展形势进行预测,由于房地产市场受季节影响,我们利用CMA(中心化移动平均值)方法计算出各个季节指数,再用09年的预测值乘以相对应的指数比,即得到09年各个季度的增长预测值。
四个季度的房地产合成指标的预测结果分别为:
30.25,40.07,35.74,58.83。
对于问题二,根据附件一,得出影响房地产业发展的四个因素分别为房地产业利润率、年度家庭全部收入与房价之比、居民个人收入与每平米房价之比、房地产业投资与社会全部固定资产投资之比。
通过SPSS软件聚类分析把2003年至2008年的房地产泡沫现象分为轻度泡沫、中度泡沫以及严重泡沫三个等级,通过Matlab建立学习向量化神经网络(LVQ),并对计算2009年的泡沫程度进行预测根据拟合出来的未来某年的4个因素数据,预测出该年的泡沫程度,并因此对相关部门提出适当的建议。
对于问题三,在确定房地产的健康稳定发展的前提下建立模型三,对2009年开始至2015年的房价进行拟合得出每年增加的社会职工平均工资增加率,并据此得出政府应该采取的相应政策。
关键字:
逐步回归模型;SPSS;CMA(中心化移动平均值);聚类分析;LVQ型神经网络;社会职工平均工资增加率。
1.问题重述
1.1背景
住房问题是关系民生的大问题。
自2001年以来,随着居民生活水平提高,居民消费结构升级带动产业结构升级,工业化进程加快和城镇化率快速提高,使中国经济进入了以住房、汽车、电子通讯、能源和基础原材料业较快发展的新一轮增长周期。
其中,房地产、钢铁、水泥等行业投资迅猛增长,带动了整个固定资产投资的快速增长。
2004年1-2月份固定资产投资完成额增长53%,经济运行中出现了新的不平衡,能源、运输供应紧张,居民消费品价格指数(CPI)开始走高(6月同比上涨5%),中国经济运行出现偏热的迹象。
从2003年下半年开始,房地产业在发展过程中出现了部分地区房地产投资过热、房价上涨过高的现象,各项指标表明中国房地产存在一定程度的泡沫(测定房地产泡沫的指标可参照附件一)。
为保持经济健康稳定的发展,近年来,中央政府综合运用经济、法律和必要的行政手段,以区别对待和循序渐进的方式,对房地产业连续出台了一系列宏观调控政策。
从阶段和性质上分析,可划分为两个阶段。
第一阶段:
2003年以“121号文”为标志,紧缩型房地产调控拉开序幕,2004年调控加强,2005-2006年达到高潮,2007年属于持续阶段,并延续至2008年上半年。
第二阶段:
从2008年下半年开始,由地方到中央,开始放松调控,其性质是松绑,节奏逐渐加快,这是一个过渡性的阶段。
总体来看,调控初见成效。
但房地产市场仍然存在住房供给结构不合理、部分城市房价上涨太快、中低收入居民住房难以满足等问题。
2008年,在世界金融危机和国内经济下行的双重外部压力下,在行业自身调整的内部推动下,全国房地产市场出现了周期性变化,由增长期转变为衰退期,2009年世界经济形势非常严峻,这场百年一遇的金融危机,目前尚看不出何时会到底,最坏的时间或许还没有到来,世界经济步入衰退,已没有什么悬念,这必将对我国房地产业产生巨大影响。
1.2要求
附件二提供了1998——2008年我国相关房地产政策,附件三提供了某城市2003——2008年房地产业的部分数据。
请根据有关数据针对以下问题进行研究:
(1)试建立数学模型阐述房地产市场发展与经济发展的关系,并预测2009年该市的房地产市场发展形势如何?
(2)试建立数学模型分析影响房地产业发展的因素,并阐述该模型对于政府调控房地产市场有何指导作用?
(3)作为建设小康社会的一项重要指标,在房地产业健康稳定发展的前提下(可参照附件一中的部分指标),欲使该市人均住房面积在2015年达到30平方米,政府应采取哪些措施?
2.模型的基本假设
为了简化问题,我们作以下合理的假设:
1.本文模型得出的相关结论是建立在该市所提供的数据基础上的,对于其他城市不一定具有参照性;
2.题目所给的数据具有一定的正确性,不会对模型的分析和计算有影响;
3.从2003-2009年该市不发生特大的自然灾害;
4.2009-2015年该市不发生较大的经济波动。
3.符号说明
AP:
社会职工平均工资
W:
商品房销售额
S:
商品房销售面积
as:
年末城区人均住宅使用面积
m:
家庭平均人数
p:
每年增加的社会职工平均工资增加率
4.问题分析
房地产作为人类生存和发展的空间,它与国民经济间的复杂关系表明,在保持国民经济快速健康发展的前提下,实现房地产业的健康和可持续发展,是建设小康社会的必然要求。
对于问题一,研究房地产市场发展与经济发展的关系,我们先考虑影响房地产市场发展的因素,主要有房地产开发投资,影响该市经济发展的因素主要有全市生产总值、城镇以上固定资产投资额、房地产开发投资、居民消费价格总指数、居民居住消费价格指数、城市居民人均可支配收入和城市居民人均消费支出。
房地产市场发展与经济发展的关系就转化为房地产开发投资与这7项指标之间的关系。
由于一元对多元,因此考虑使用多元线性回归模型来分析问题。
然后利用SPSS软件求解问题。
预测2009年该市的房地产市场发展形势,我们拟合出各年房地产业生产总值增加值和年份的关系,可以得出各年的房地产业生产总值增加值的情况以及函数表达式。
由于房地产业生产总值增加值受到季节的影响,利用CMA(中心化移动平均值)方法计算出各个季节指数,再用09年的预测值乘以相对应的指数比,即得到09年各个季度的增长预测值。
对于问题二,要求分析影响房地产业发展的因素,并分析该模型对于政府调控房地产市场有何指导作用。
根据附件一,得出影响房地产业发展的四个因素分别为房地产业利润率、年度家庭全部收入与房价之比、居民个人收入与每平米房价之比、房地产业投资与社会全部固定资产投资之比。
通过SPSS软件聚类分析把2003年至2008年的房地产泡沫现象分为三个等级,利用学习向量化神经网络(LVQ)的相关知识建立数学模型。
根据拟合出来的未来某年的4个因素数据,预测出该年的泡沫程度。
政府根据泡沫程度制定相应的调控房地产市场的措施。
对于问题三,要求在房地产业健康稳定发展的前提下(可参照附件一中的部分指标),欲使该市人均住房面积在2015年达到30平方米,政府应采取哪些措施。
根据附件一和附件三的数据,我们考虑六项指标中的两项:
年度家庭全部收入与房价之比与居民个人收入与每平米房价之比。
根据这两项因素确定该房地产的健康稳定发展的前提:
年度家庭全部收入与房价之比在0.2~0.4之间,而居民个人收入与每平米房价之比大于0.4527。
另外,考虑到社会职工平均工资的递增是一个指数的关系,则2009年开始每年增加的社会职工平均工资增加率对该市人均住房面积在2015年达到30平方米有着一定的影响。
5.模型建立和求解
5.1问题一的模型建立和求解
5.1.1模型的准备
房地产业与经济发展有着紧密的联系,是经济发展的“晴雨表”,房地产市场的繁荣和萧条与金融稳定密切相关。
根据经济学原理,经济发展和CDP全市生产总值、固定资产投资、居民的收入和消费有着密切的关系,而房地产市场的发展与其生产总值增加值有关。
因此,我们选取全市生产总值、城镇以上固定资产投资额、房地产开发投资、居民消费价格总指数、居民居住消费价格指数、城市居民人均可支配收入和城市居民人均消费支出等7项指标形容经济发展,则房地产市场发展与经济发展的关系就转化为房地产开发投资与这7项指标之间的关系。
由于房地产业生产总值增加值为因变量,而全市生产总值、城镇以上固定资产投资额、房地产开发投资、居民消费价格总指数、居民居住消费价格指数、城市居民人均可支配收入和城市居民人均消费支出为自变量,因此采用多元线性回归模型来分析问题。
5.1.2模型的概述
逐步回归模型是多元线性模型的优化。
多元线性回归分析,通常是把所有n个自变量全部引入回归方程,不管自变量对因变量是否有显著影响,然后做复相关系数的显著性检验和因子贡献的检验。
逐步回归模型被认为是一种较合理的优化预测模型,它能自动地从大量可供选择的变量中选择那些对建立回归防长比较重要的变量,它是在多元回归的基础上派生出来的一种算法技巧。
逐步回归分析简单说来,就是把对因变量有显著作用的自变量逐个引入回归式。
首先选出与因变量相关程度最大的自变量,通过统计检验,表明该自变量的作用显著时,则将其引入回归式,然后在剩下的自变量中再挑选与因变量最密切的自变量,当已引入的变量由于后来变量的引入使它对因变量的作用由显著变为不显著时(这是因为自变量间有相关性),则随时将它们从回归式中剔除。
如此反复进行,直到再也没有一个自变量可以引入,没有一个自变量可以提出为止。
最终实现从众多自变量中“挑选”出最显著变量,建立一个优化回归模型。
.
5.1.3模型的建立
基于以上的分析,建立逐步回归数学模型,模型形式如下:
Y=β0+p=17Xp+ε
其中,因变量Y为房地产开发投资,自变量Xp,p=1,2,⋯,7,分别为全市生产总值、城镇以上固定资产投资额、房地产开发投资、居民消费价格总指数、居民居住消费价格指数、城市居民人均可支配收入和城市居民人均消费支出,β0、β1、β2、β3、β4、β5、β6、β7为待定系数,ε为随机误差,并且要求Eε=0。
5.1.4模型的求解
(1)房地产市场发展与经济发展的关系
利用SPSS软件对房地产开发投资和经济发展的6项指标间的关系进行分析。
打开SPSS菜单栏的Analyze|Regression|Linear,选择“房地产业生产总值增加值”为因变量,“全市生产总值”、“城镇以上固定资产投资额”、“房地产开发投资”、“居民消费价格总指数”、“居民居住消费价格指数”、“城市居民人均可支配收入”和“城市居民人均消费支出”为自变量,在LinearRegression对话框中的Method下拉框中选定Stepwise。
运行SPSS后输出结果如表5.1~5.4所示:
表5.1模型综述表
表5.1的模型综述表给出了逐步回归分析每一步的复相关系数R、判定系数Rsquare、调整的判定系数AdjustedRsquare,表下的附注显示每步建立的回归方程的入选变量情况。
整个逐步回归分三步完成,调整的判定系数R2分别为0.423、0.639和0.888。
表5.2方差分析表
表5.2的方差分析表给出了每步的方差分析结果,这里尾概率分别为0.001、0.000和0.000,均小于0.05,显示每步回归方程均是显著的。
表5.3系数分析表
表5.3的系数分析表给出了每步回归方程中的参数估计与回归系数的显著性检验结果。
整个逐步回归分析过程非常清晰:
先引入变量全市生产总值,建立一元回归模型,接着引入变量城镇以上固定资产投资额,建立二元回归方程,最后引入变量城市居民人均可支配收入,建立三元回归方程,剩下的变量:
居民消费价格总指数、居民居住消费价格指数和城市居民人均消费支出对房地产开发投资不再具有显著影响,最终建立的回归方程为:
Y=12.557+0.133∙X1-0.07∙X2-0.017∙X6
注意到各回归系数显著性检验的尾概率都非常小,说明入选的变量全市生产总值、城镇以上固定资产投资额、城市居民人均可支配收入均是显著的,同时回归方程也用过了整体的显著性检验,说明这个最终模型是适当的,模型优化效果明显。
表5.4剔除变量表
由回归方程
Y=12.557+0.133∙X1-0.07∙X2-0.017∙X6
我们可以看到房地产业总值增加值与全市生产总值、城镇以上固定资产投资额以及城市居民人均可支配收入是一个多元线性回归的关系。
房地产业总值增加值与全市生产总值是一个正相关的关系,与城镇以上固定资产投资额以及城市居民人均可支配收入是一个负相关的关系。
但是,总体上,随着经济的发展,房地产业总值增加值是增加的。
这就意味着经济的发展在一定程度上促进了房地产业的发展,因此经济的持续发展,是保证房地产业发展的经济基础与前提。
(2)09年房地产市场预测
以年为单位,取2004——2008五组数据做线性拟合。
年份
2004
2005
2006
2007
2008
房地产业总值增加值
83.7
91.13
127.24
141.11
150.37
表5.504-08年房地产业总值增加值表
图5.1年房地产业总值增加值图
下表5.6给出了线性拟合的复相关系数R、判定系数Rsquare、调整的判定系数AdjustedRsquare、标准误差和观测值。
调整的判定系数AdjustedRsquare为0.924,线性拟合效果显著。
表5.6回归分析表
表5.7方差分析表给出了线性拟合的F统计量和对应的SignificantF值。
从表中可以看到,F统计量为49.75978,对应的SignificantF为0.005855885。
所以,拟合的效果是显著的。
表5.7方差分析表
表5.8残差表给出了各个观测值的残差,从表可见各点的残差均比较小,拟合的效果较为显著。
表5.8残差表
图5.2残差图
表5.9给出了线性拟合的曲线方程,拟合后的方程为y=18.332∙x-36655.282,y为房地产业生产总值增加值,x为年份。
表5.9拟合曲线表
由方程y=18.332∙x-36655.282可预测得到09年房地产业生产总值的增长值为173.7。
通过各个季节的图像,可以发现季节的变化对增长值有着比较明显的影响。
利用CMA(中心化移动平均值)方法计算出各个季节指数,再用09年的预测值乘以相对应的指数比,即得到09年各个季度的增长预测值。
结果如下表5.10:
季度
一季度
二季度
三季度
四季度
指数
0.716442
1.020053
0.846407
1.417098
09年各季度房地产业总值增加值(亿元)
31.11
44.30
36.76
61.54
表5.1009年季度房地产业总值增加值表
5.1.5模型的优化
由于09年房地产市场预测模型计算时缺少03年的数据,我们对03年的两个数据加以考虑,用那两个数据反推出那一年的房地产业总值增长值。
这样做的好处是:
多一组数据使得得到的回归函数更有说服力。
由于03那年只有2个数据,我们可以关于最小二乘法拟合做一个小改动,使得03这组数据的影响只有其他数据的一半。
年份
2003
2004
2005
2006
2007
2008
房地产业总值增加值
78.5
83.7
91.13
127.24
141.11
150.37
表5.1103-08年房地产业总值增加值表
利用上述同样的方法,分别获得回归分析表、方差分析表、残差分析表和残差图。
表5.12回归分析表
表5.13方差分析表
表5.14残差分析表
图5.3残差图
表5.15拟合曲线表
从图表5.14-5.18,可知优化模型的拟合效果显著。
拟合后的方程为y=16.20994∙x-32397,y为房地产业生产总值增加值,x为年份。
则09年各个季度的增长预测值为:
季度
一季度
二季度
三季度
四季度
指数
0.716442
1.020053
0.846407
1.417098
09年各季度房地产业总值增加值(亿元)
30.25
43.07
35.74
59.83
表5.1609年季度房地产业总值增加值表
5.2问题二的模型建立和求解
5.2.1模型准备
根据附件一,我们得出影响房地产业发展的五个因素:
房地产业利润率、年度家庭全部收入与房价之比、居民个人收入与每平米房价之比、房地产业投资与社会全部固定资产投资之比、房屋租售比(房屋租赁价格指数)。
要分析这些因素对于政府调控房地产市场有何指导作用,对此问题我们利用聚类分析和学习向量化神经网络(LVQ)的相关知识建立数学模型。
(1)因素分析
l因素1.房地产业利润率
房地产业利润率=房地产业生产总值增加值房地产开发投资
由上式,我们算出03-08年的房地产业利润率,结果如下:
年份
2003
2004
2005
2006
2007
2008
房地产业利润率
0.511
0.515
0.407
0.495
0.438
0.403
l因素2.年度家庭全部收入与房价之比
年度家庭全部收入房价=社会职工平均工资×m商品房销售额商品房销售面积×年末城区人均住宅使用面积×m
由上式,我们算出03-08年的年度家庭全部收入与房价之比,结果如下:
年份
2003
2004
2005
2006
2007
2008
年度家庭全部收入与房价之比
0.322
0.213
0.181
0.176
0.187
0.178
l因素3.居民个人收入与每平米房价之比
居民个人收入每平方米房价=社会职工平均工资12商品房销售额商品房销售面积
由上式,我们算出03-08年的居民个人收入与每平米房价之比,结果如下:
年份
2003
2004
2005
2006
2007
2008
居民个人收入与每平米房价之比
0.521
0.429
0.378
0.378
0.371
0.397
l因素4.房地产业投资与社会全部固定资产投资之比
房地产业投资社会全部固定资产投资=房地产开发投资城镇以上固定资产投资
由上式,我们算出03-08年的房地产业投资与社会全部固定资产投资之比,结果如下:
年份
2003
2004
2005
2006
2007
2008
房地产业投资与社会全部固定资产投资之比
0.252
0.183
0.166
0.182
0.197
0.191
l因素5.房屋租售比(房屋租赁价格指数)
房屋租售比=房屋每平方米租金每平方米售价=房屋租赁价格指数
由上式,我们算出03-08年的房屋租售比,结果如下:
年份
2003
2004
2005
2006
2007
2008
房屋租售比
101.4
100
103.3
110.1
108.3
115.3
(2)聚类分析的基本思想
在这里我们采用系统聚类分析的方法对03-08年的数据进行分类,以确定他们究竟是属于没有泡沫、轻度泡沫、中度泡沫还是严重泡沫。
系统聚类分析的基本思想是:
距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚成合适的类中。
系统聚类的过程是:
假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离相近的两个样品(或变量)聚合成一类,其他的样品(或变量)仍聚成为一类,这样,形成(n-1)类;第三步将(n-1)个类中“距离”最近的两个类进一步聚成一类,这样,形成(n-2)类;⋯⋯以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类。
(3)学习向量化神经网络(LVQ)
学习向量量化化(LVQ)神经网络是一种有芬兰学者kohonen提出的有监督神经网络,用于求解分类问题,LVQ是在有监督状态下度竞争层进行训练的一种学习算法,其实质是一种根据样本模式的特性,进行“奖—惩”的迭代学习算法,基本思想是:
对于来自训练集中的样本向量,如果样本与最近神经元属同一类,则无需学习,否则将惩罚分类错误的神经元,奖励分类正确的神经元,竞争层将自动学习对输入向量进行分类,这种分类的结果仅仅依赖于输入向量之间的距离,如果两个向量之间特别的相近,竞争层就把他们分到同一类。
LVQ网络含竞争层和目标分类层。
其拓扑图如下:
类N
类2
类1
输出层
输入层
……
LVQ网络拓扑结构
5.2.2模型的建立
Step1
对03-08年的相关数据做处理,由于房屋租售比均属于无泡沫,故舍弃因素5,只考虑房地产业利润率、年度家庭全部收入与房价之比、居民个人收入与每平米房价之比、房地产业投资与社会全部固定资产投资之比这四个因素。
Step2
利用SPSS软件对03-08年的数据进行系统聚类分析。
Step3
根据得出