人口预测模型(优秀论文)(1).doc

资源描述

人口预测模型(优秀论文)(1).doc

《人口预测模型(优秀论文)(1).doc》由会员分享，可在线阅读，更多相关《人口预测模型(优秀论文)(1).doc（25页珍藏版）》请在冰点文库上搜索。

人口预测模型(优秀论文)(1).doc

中国人口预测模型

摘要

本文对人口预测的数学模型进行了研究。

首先，建立一次线性回归模型，灰色序列预测模型和逻辑斯蒂模型。

考虑到三种模型均具有各自的局限性，又用加权法建立了熵权组合模型，并给出了使预测误差最小的三个预测模型的加权系数，用该模型对人口数量进行预测，得到的结果如下：

单位：

（万人）

年份

2006

2007

2008

2009

2010

预测值

134840.9

137027.35

1377785.7

139360.4

140857.4

其中加权系数为：

0.24282，0.34055，0.41663。

其次，建立Leslie人口模型，充分反映了生育率、死亡率、年龄结构、男女比例等影响人口增长的因素，并利用以1年为分组长度方式和以5年为分组长度方式预测短期和长期人口增长，得如下数据：

年份

2006

2007

2008

2009

2010

2011

2012

人数（万）

130990

131230

131430

131620

131800

132000

132220

年份

2016-2020

2021-2025

2026-2030

2031-2035

2036-2040

2041-2045

2046-2050

人数（万）

144000

148000

150000

151000

150000

149000

然后对Leslie人口模型进行了改进，构建了反映生育率和死亡率变化率负指数函数，并给出了反映城乡人口迁移的人口转移向量。

最后我们BP神经网络模型检验以上模型的正确性

关键字：

一次线性回归灰色序列预测逻辑斯蒂模型Leslie人口模型

BP神经网络

一、问题重述

1.背景

人口增长预测是随着社会经济发展而提出来的。

在过去的几千年里，由于人类社会生产力水平低，生产发展缓慢，人口变动和增长也不明显，生产自给自足或进行简单的以货易货，因而对未来人口发展变化的研究并不重要，根本不用进行人口增长预测。

而当今社会，经济发展迅速，生产力达到空前水平，这时的生产不仅为了满足个人需求，还要面向社会的需求，所以必须了解供求关系的未来趋势。

而人口增长预测是对未来进行预测的各环节中的一个重要方面。

准确地预测未来人口的发展趋势，制定合理的人口规划和人口布局方案具有重大的理论意义和实用意义。

2.问题

人口增长预测有短期、中期、长期预测之分，而各个国家和地区要根据实际情况进行短期、中期、长期的人口预测。

例如，中国人口预期寿命约为70岁左右，因此，长期人口预测最好预测到70年以后，中期40—50年，短期可以是5年、10年或20年。

根据2007年初发布的《国家人口发展战略研究报告》（附录一）及《中国人口年鉴》收集的数据（附录二），再结合中国的国情特点，如老龄化进程加速，人口性别比升高，乡村人口城镇化等因素，建立合理的关于中国人口增长的数学模型，并利用此模型对中国人口增长的中短期和长期趋势做出预测，同时指出此模型的合理性和局限性。

二、问题的基本假设及符号说明

问题假设

1．假设本问题所使用的数据均真实有效，具有统计分析价值。

2．假设本问题所研究的是一个封闭系统，也就是说不考虑我国与其它国家的人口迁移问题。

3．不考虑战争瘟疫等突发事件的影响

4．在对人口进行分段处理时，假设同一年龄段的人死亡率相同，同一年龄段的育龄妇女生育率相同。

5．假设各年龄段的育龄妇女生育率呈正态分布

6．人类的生育观念不发生太大改变，如没有集体不愿生小孩的想法。

7.中国各地各民族的人口政策相同。

符号说明

--------------------第t时间区间内第i个年龄段人口总数

--------------------第t时间区间内第i个年龄段人口总数占总人口的比例

--------------------第t时间区间内第i个年龄段中第k年龄值人口总数占总人口的比例

--------------------第t时间区间内各年龄段人口总数的向量

--------------------第t时间区间各年龄段人口总数向量转移矩阵

-------------------第t时间区间内第i个年龄段人的生育率

-------------------第t时间区间内第i个年龄段人的死亡率

-----------------第t时间区间内第i个年龄段中第k年龄值的死亡率

-------------------第t时间区间内第i个年龄段人的存活率

---------------------第t时间区间男性人数与女性人数的比值

---------------------第t时间区间内第i个年龄段育龄妇女的生育率

m---------------------------每个年龄段上年龄值的数目

三问题分析

本问题是一个关于人口预测的问题，与以往不同，本问题需要根据中国特殊的国情去研究，我们根据对问题的分析并结合实际情况认为对人口产生主要影响的因素有以下四个：

生育率、死亡率、年龄结构、男女比例。

在这里需要说明的是对于人口产生影响的一些因素，如经济发展状况，生态环境情况、已婚夫妇对生育所持的态度、医疗技术的发展等，我们认为它们对人口的增长是通过作用于以上四个指标而间接发挥作用的。

而对于诸如战争爆发、疾病流行等突发因素，由于其不可预测性，我们不考虑

1．生育率

生育率代表育龄妇女生育人口的能力，从一定意义上讲生育率的高低控制着人口增长率高低，通常来说生育率越高人口增长率越高，所以说生育率是人口增长的源头。

生育率的影响因素很多，首先是年龄因素，不同年龄段的育龄妇女的生育率不同，通常20岁至30岁的育龄妇女的生育率最强；此外是地域因素，受政策因素、观念认识、周边环境等影响乡村育龄妇女的生育率高于城市育龄妇女的生育率；还有其它因素的影响，比如大规模疾病会降低育龄妇女的生育率。

2．死亡率

死亡率表示一定时期内一个人口群体中死亡的人数占该人口群体的比值，和生育率一样死亡率的高低同样控制着人口增长率高低，如果说生育率是人口增长的源头，则死亡率是人口增长的汇点。

同样影响死亡率的因素很多，首先不同年龄段的死亡率不同，通常老年人和刚出生的婴儿的死亡率较高；从长远来看，随着医疗水平的提高，整个人口群体的死亡率将会成下降趋势；此外一些突发事件，如战争、疾病等，将会使使那一段的人口死亡率大幅度提高。

3．年龄结构

年龄结构反映了总体人口在各年龄段分布情况，年龄结构蕴涵的信息量很大，从其中我们可以实现对很多问题的分析，比如从年龄结构我们可以分析出社会的老年化程度，此外从年龄结构我们可以判断出不同时间段人口出生的情况，比如年龄结构不仅反映了总体人口在各年龄段分布情况，而且考虑到不同年龄段人口生育率、死亡率不同等情况，我们可以在年龄结构中有效反映这些差异

4．男女比例

男女比例反映了总体人口中男性与女性人数的比较关系，男女比例值能反映出体人口中男性与女性人数是否协调，男女比例主要受男女出生比和男女死亡率的影响，男女出生比正常范围在103－107，也就是说出生100个女儿的同时会有103—107个男儿出生，但是在现实社会中，女性死亡率低于男性，所以男性与女性人数大致相等，社会维持在一个稳定状态。

但目前我国男女出生比超过110，这不仅将导致男女比例失调，还会对人口的预测产生影响，所以在人口预测时必须将男女比例问题考虑进去。

考虑到人口预测分为中短期预测和长期预测，两类预测因为涉及的时间长短不同，所以考虑的因素不同，采用的方法不同。

对于中短期预测，我们假设生育率、死亡率、年龄结构、男女比例均维持在同一稳定水平，这样我们采用方法有很多，。

对于长期预测，我们需要考虑生育率、死亡率、年龄结构、男女比例等因素随时间变化，此外城乡人口迁移对城乡人口结构产生影响，尽管以上因素短期内积累效应较小，但在长期中必须考虑。

在预测方法上我们选用了基于以往人口数据的一次线性回归，灰色、时间序列预测，逻辑斯蒂模型和基于年龄结构并生育率、死亡率随时间Leslie人口模型出生率

年龄结构

按影响增长因素建立模型型

男女比例

Leslie人口模型

死亡率

中国人口预测模型

按人口统计量建立模型

一次线型回归

逻辑斯蒂

灰色预测

熵权法组合模型

中短期

长期

BP神经网络模型

四数学模型

4.1.熵权组合模型

有关于人口增长预测的模型很多，比如灰色GM（1，1），移动平均数法，指数平滑法，一元线型回归，马尔萨斯人口模型，宋健人口模型等等，但是每种预测方法的精度往往也不同。

组合模型和单个模型比起来，具有较高的预测精度，组合预测的关键就在于确定各个预测方法的权重。

本文将从一个新的角度进行研究，即从信息论的观点出发，根据各个体预测方法误差指标的信息熵，确定组合预测模型的权重，进行人口组合预测模型。

本文选用了一元线性回归法，逻辑斯蒂模型法，灰色GM（1，1）模型法对中国人口增长进行预测。

而1978至2005年的数据见本文表一。

.4..1.1灰色预测模型

1.模型建立

灰色系统是指部分信息已知，部分信息未知的系统。

灰色系统的理论实质是将无规律的原始数据进行累加生成数列，再重新建模。

由于生成的模型得到的数据通过累加生成的逆运算――累减生成得到还原模型，再有还原模型作为预测模型。

预测模型，是拟合参数模型，通过原始数据累加生成，得到规律性较强的序列，用函数曲线去拟合得到预测值。

灰色预测模型建立过程如下：

1）设原始数据序列有n个观察值，，通过累加生成新序列，利用新生成的序列去拟和函数曲线。

2）利用拟合出来的函数，求出新生序列的预测值序列

3）利用累减还原：

得到灰色预测值序列：

（共n＋m个，m个为未来的预测值）。

将序列分为和，其中反映的确定性增长趋势，反映的平稳周期变化趋势。

利用灰色GM（1，1）模型对序列的确定增长趋势进行预测

2模型求解

根据2006全国统计年鉴数据整理得到全国历年年度人口统计表如表1.

表1：

全国历年年底的人口统计

年份

1978年

1980年

1985年

1989年

1990年

1991年

1992年

总人口

/万人

96259

98705

105851

112704

114333

115823

117171

年份

1993年

1994年

1995年

1996年

1997年

1998年

1999年

总人口

/万人

11857

119850

121121

122389

123626

124761

125743

年份

2000年

2001年

2002年

2003年

2004

2005年

总人口

/万人

126743

127627

128453

129227

129988

130756

根据上述数据，建立含有20个观察值原始数据序列：

利用Matlab软件对原是数列进行一次累加，得到新数列为，如表2：

表2：

新数列误差和误差率

拟核值

108504

109773

111056

112354

113668

114997

116343

误差

-9799.1

-3921.8

1647.8

1978.3

2154.6

2173.6

2175.0

误差/﹪

-9.93

-3.70

1.46

1.73

1.86

1.84

拟核值

117702

119079

120471

121879

123304

124746

误差

2147.7

2042.5

1918.2

1746.6

1456.6

1039.9

538.3

误差/﹪

1.79

1.69

1.57

1.41

1.17

0.83

0.42

拟核值

126204

127680

129173

130683

132211

133757

误差

-53.3

-720.1

-1456.4

-2223.4

-3001.3

-3010.4

误差/﹪

-0.04

-0.56

-1.13

-1.71

-2.30

-2.42

1、利用表2，拟合函数，如下：

2、精度检验值

c＝0.3067（很好）

P＝0.9474（好）

3、得到未来20年的预测值：

表3：

全国历年年底的人口统计未来20年预测值

年份

2006年

2007年

2008年

2009年

2010年

2011年

总人口

/万人

135321.2

136903.4

138504.1

140123.5

141761.9

143419.4

145096.2

年份

2012年

2013年

2014年

2015年

2016年

2017年

2018年

总人口

/万人

146792.7

150245.5

152002.2

153779.4

155577.4

157369.5

159236.8

年份

2019年

2020年

2021年

2022年

2023

总人口

/万人

161098.7

162982.2

164887.8

166815.7

168766.2

4.1.2一元线性回归法

根据表一中的数据，本文建立一元线性回归模型进行预测；

为人口数单位：

万人为年份。

利用Matlab软件，用麦夸特法进行回归拟合，得到拟核值及回归方程，如下：

表八一元线性回归模型拟合值

104546.9

106119.3

107691.6

109264

110836.4

112408.8

113981.2

拟合值

115553.5

117125.9

118698.3

120270.7

121843.1

123415.5

124987.8

126560.2

128132.6

129705

131277.4

132849.7

134422.1

由此，建立如下的一元线性回归方程