1、 _评阅教师: _基于Leslie模型的中国人口预测 (华北科技学院,河北廊坊)摘要:本文通过对我国人口基本国情的研究,主要预测了中国人口增长情况及增长过程中相关人口指数的变化。考虑到城镇(市、镇)和农村在迁移、生育、死亡等方面的差异。本文对城镇和农村分别讨论,建立了长期人口变化的带有人口迁移项的Leslie离散模型。在总和生育率为1.8的情况下,进行了中国人口预测。本文创新之处:总和生育率为1.8符合中国政策,利于人口与经济社会的协调发展;建立了合理的的Logistic预测模型。关键词:中国人口预测;Leslie离散模型;人口迁移; 总和生育率;城镇化水平1 问题分析人口问题一直是我国关注的
2、焦点之一,对我国人口各项指标的预测有着深远的意义。目前中国人口最突出的特点是:老龄化加速,出生人口性别比持续增高和乡村人口城镇化。影响人口变化的因素众多,如出生、死亡、迁移、性别比、人口素质、社会环境、生育政策等等,同时各影响因素之间存在着相互的影响关系,而且也随着时间发生变化,导致预测模型尤其是长期预测模型难度较大。至今有关人口预测的模型主要有人口发展方程、Leslie模型、Logistic模型、回归分析等。长期预测需综合考虑各影响因素。通过分析,本文以人口的生育、死亡、迁移作为主要影响因素,并通过Leslie模型将三种影响因素联系起来,确定扩展的Leslie模型。同时,本文分别采用Logi
3、stic模型,图形分析,函数拟合等对以上三种因素做出随时间变化的动态方程,即参数方程。2 模型假设(1) 在预期的时间内,不发生大的瘟情、灾难或战争等引起人口重大变化的事件;(2) 我国看成一个封闭系统,即没有人口的迁入和迁出;(3) 人口增长只与人口基数、生育、死亡和迁移有关;(4) 国内人口迁移为农村向城市的单向迁入,且关于年龄的分布不随时间变化;(5) 90岁以上的人口统视是为一个年龄段群体。(6) 中短期内,死亡率和出生性别比不发生大的波动,以往年平均值代替预测值。3 符号说明 、分别表示t到t+1年第r个年龄段总人口、人口死亡率、女性生育率、女性生育模式、女性性别比、净迁移人口、人口
4、迁移率(迁移人口比总人口);R(t)为第t年城市化水平(城市人口比总人口);(t)为总和生育率。为了分别考虑城镇(市、镇)、农村人口的发展,以上各参数上标i为1时代表城镇,为2时代表农村,以下出现各参数上标同此。4 模型建立添加迁移项的Leslie模型如下: 其中 Hi(t)= Bi(t)= 5 模型求解 5.1 生育项参数的计算对人口出生率的预测不仅考虑育龄女性人口的比例,也要考虑生育模式,即育龄女性的生育率随年龄的概率密度分布。 5.1.1 育龄女性人口比例分析 图1 育龄女性总生育率随年龄的分布关系 对2001年至2005年五年内(由于SARS的影响,03年数据出现异常,故求平均值是删除
5、了03年后的数据)的育龄女性生育率数据及平均绘图1分析可得: (1) 五年的育龄女性生育率围绕平均值上下波动,但波动范围较小。 (2) 育龄女性人口比例随年龄的分布虽然随时间的变化而发生扰动,但扰动比较微弱。 因此本文用五年内育龄女性人口比例的平均值作为对育龄女性人口比例的预测值。5.1.2 育龄女性生育模式分析 按照 (t)=计算01-05各年总和生育率,列表如下(由于SARS的影响,03年数据出现异常,故求平均值是删除了03年后的数据): l 表1 :历年总和生育率20012002200320042005平均值(剔除03)城市1.0020.9600.0951.0480.9260.984乡镇
6、1.1891.2030.1321.3471.2781.254农村1.6041.6530.1681.6871.6541.649按各地区育龄妇女总数对值加权平均,可以得到全国妇女总和生育率为1.375。根据国家计划,30年内应该把总和生育率控制在1.8以内才能将人口峰值控制在15亿。按照现在的总和生育率,并不需要再降低总和生育率。我们推测存在隐瞒黑户不报等状况,导致普查得到总和生育率低于实际值,中短期预测仍采用1.8作为全国妇女总和生育率。由= 可计算出生育模式,以城市妇女为例,作图如下: 图1: 各年份城市女性生育模式图由上图可见生育模式很稳定,随年份波动很小,因此中短期预测中可以取其平均值作为
7、生育模式。 5.2 城镇化水平的Logistic预测模型根据发达国家的城镇化经历,一个国家或地区的城镇化过程大致成一条拉平的“s”形曲线。因为Logistic函数具有典型的“s”形曲线特征,同时含有“环境容纳量”和“内禀增长率”等较深刻的生物学意义,比较符合自然界和人类社会发展规律,因此本文用Logistic模型来预测我国的城镇化进程。模型的方程建立如下: (1)其中R(t)为第t年城市化水平(城市人口比总人口)。据文献,到2020年,中国城镇化率将达到最大值,中国城镇化将逐渐变缓,最终进入城镇化比率为0.7-0.8的平稳区。取RMax=0.75,k为城市化水平增长率(内禀增长率)。 求解(1
8、)得R(t)= (2) 利用国家统计局对我国三十年来城市化水平的统计数据(文献3),通过最小二乘法确定k=0.080,c=2.24求解(2)得: , (3) 2005年至2015年城镇化比率如下图: 图2:城镇化比率 5.3 年龄-迁移率分布由基本假设(4),迁移率随年龄的分布不随时间变化,因此只需要确定某年迁移率随年龄的分布即可。取上海市2000年总体迁移人口中个年龄段人口所占比例为代表数据,借助Matlab拟合工具箱对数据做三项移动法平滑处理,根据方差分析多次尝试后选取混合正态分布函数做最终拟合函数,归一化后如下:, (4)拟合显著性判断参数为SSE:3.22、R-square:0.979
9、1。6 模型的检验和评价6.1 蒙特卡罗方法与计算机仿真来对模型进行检验用蒙特卡罗方法仿真人口问题,根据现有的生育、生存、死亡、男女比例等统计资料,我们找出相应的概率分布,称其为概率分布函数。对每个人口样本,用一组随机数来模拟其发展,这个人口个体的集合就相当一组人口样本。分析这组样本,便可以某些问题的解答。蒙特卡罗仿真过程:首先,本仿真过程需要已知起始以及终止年份、生育率、时变死亡率、第一年的人口分布(包括总人口,男女人口,按年龄分布的人口)、时变迁移率。这些条件在先前的论文中均已求解出。 其次,本仿真过程需要的5种随机函数。分别是:出生概率随机数产生函数、死亡概率随机数产生函数、城镇年龄随机
10、数产生函数、乡村年龄随机数产生函数、性别随机数产生函数以分别完成生育抽样、死亡抽样、城市年龄抽样、乡村年龄抽样以及性别抽样。 通过足够次数的抽样过程来模拟仿真中国人口的变化过程,每次抽样完成后进行人口结构调整。由于中国正处在农村人口向城市人口迁移的阶段,所以对人口迁移的考虑是必须的,这里是把中国人口分为城镇与乡村两部分,每次抽样过后,还要进行因迁移而造成的人口调整。 综上所诉,采用递推的方法,即可由第N年的人口数据信息推出N+1年的人口数据信息。这样我们就可以由2001年的人口数据以及各种参数变化率的分布函数,推出往后每年的人口数据。6.2 模型的评价 模型的优点和不足: (1) 本文充分考虑
11、我国人口实际国情,对城市化、生育模式进行模型预测,结果涵盖了各主要的人口指标。 (2) 对中国人口进行预测时,考虑了人口发展的最主要影响因素,并结合各因素的时变特征做出相应的预测。 (3) 本文运用了蒙特卡罗方法仿真人口进行检验,检验结果良好。但所建建模还有一些不足,如对历史数据要求较大,参数确定不够灵活,可能影响长期预测结果,需在今后继续深入研究。参考文献:1 谭永基,蔡志杰,数学模型,复旦大学出版社,2005-22 赵静,但琦,数学建模与数学实验(第3版),高等教育出版社,2008-13 国家人口发展战略研究报告OL,www.C,2007-9-254 潘红宇,时间序列分析M,北京:对外经济贸易大学出版社,2005
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2