leslie人口增长模型.docx
《leslie人口增长模型.docx》由会员分享,可在线阅读,更多相关《leslie人口增长模型.docx(67页珍藏版)》请在冰点文库上搜索。
leslie人口增长模型
人口增长预测模型
摘要
本文建立了我国人口增长的预测模型,对各年份全国人口总量增长的中短期和长期趋势作出了预测,并对人口老龄化、人口抚养比等一系列评价指标进行了预测。
最后提出了有关人口控制与管理的措施。
模型Ⅰ:
建立了Logistic人口阻滞增长模型,利用附件2中数据,结合网上查找补充的数据,分别根据从1963年、1980年、2005年到2012年四组总人口数据建立模型,进行预测,把预测结果与附件1《国家人口发展战略研究报告》中提供的预测值进行分析比较。
得出运用1980年到2005年的总人口数建立模型预测效果好,拟合的曲线的可决系数为0.9987。
运用1980年到2005年总人口数据预测得到2010年、2020年、2033年我国的总人口数分别为13.55357亿、14.18440亿、14.70172亿。
模型Ⅱ:
考虑到人口年龄结构对人口增长的影响,建立了按年龄分布的女性模型
(Leslie模型):
以附件2中提供的2001年的有关数据,构造Leslie矩阵,建立相应Leslie模型;然后,根据中外专家给出的人口更替率1.8,构造Leslie矩阵,建立相应的Leslie模型。
首先,分别预测2002年到2050年我国总人口数、劳动年龄人口数、老年人口数(见附录8),然后再用预测求得的数据分别对全国总人口数、劳动年龄人口数的发展情况进行分析,得出:
我国总人口在2010年达到14.2609亿人,在2020年达到14.9513亿人,
在2023年达到峰值14.985亿人;预测我国在短期内劳动力不缺,但须加强劳动力结构方面的调整。
其次,对人口老龄化问题、人口抚养比进行分析。
得到我国老龄化在加速,预计本
世纪40年代中后期形成老龄人口高峰平台,60岁以上老年人口达4.45亿人,比重达33.277%;65岁以上老年人口达3.51亿人,比重达25.53%;人口抚养呈现增加的趋势。
再次,讨论我国人口的控制,预测出将来我国育龄妇女人数与生育旺盛期育龄妇女人数,得到育龄妇女人数在短期内将达到高峰,随后又下降的趋势的结论。
最后,分别对模型Ⅰ与模型Ⅱ进行残差分析、优缺点评价与推广。
关键词Logistic人口模型Leslie人口模型人口增长预测MATLAB软件
1
§1、问题重述
一、背景知识:
中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。
我国人口发展经历了多个阶段,近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。
全面建设小康社会时期是我国社会快速转型期,人口发展面临着前所未有的复杂局面,人口安全面临的风险依然存在
二、相关数据:
附件1《国家人口发展战略研究报告》
附件2人口数据(《中国人口统计年鉴》中的部分数据)及其说明根据已有数据
三、要解决的问题:
1、试从中国的实际情况和人口增长的上述特点出发,参考附件2中的相关数据(也可以搜索相关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;特别要指出你们模型中的优点与不足之处。
2、利用所建立模型的预测结果,参照附件1的相关叙述对反映中国人口增长特点的一系列指标如人口老龄化、人口抚养比等进行分析预测。
3、根据模型的计算结果,对未来人口发展高峰进行预测并针对中国人口的调控和管理进行分析。
§2、问题分析
人口的变化受到众多方面因素的影响,因此对人口的预测与控制也就十分复杂,很难在一个模型中综合考虑到各个因素的影响。
为了更好的解决此问题,我们分析了题目以及附录1中所给的相关信息,考虑到可以根据对人口增长不同的评价指标及不同的时期建立多个模型分别加以讨论。
一、从附件1中,我们看到过去一些专家对中国的总人口数做出了2010年、2020
年分别达到13.6亿人和14.5亿人,2033年前后达到峰值15亿人左右的预测。
因而,
我们也可以先对总人口的增长趋势做出自己的预测与专家预测数据进行比较,对于预测
所要用到的一些相关数据,我们作了相应的补充,由此我们建立了模型Ⅰ:
阻滞增长模型。
二、模型Ⅰ只考虑了人口总数,对人口总数进行了预测分析。
但实际中在对人口进行分析时,按年龄段分布的人口结构是非常重要的。
在人口总数一定时,不同年龄段的人的生育率和死亡率是不同的,它们对人口未来发展的影响也是很不一样的。
为了讨论
不同年龄段的人口分布对人口增长的影响,我们依据附件2建立了模型Ⅱ:
按年龄分布
的Leslie模型。
三、由模型Ⅰ和模型Ⅱ的结果我们预测了人口总数的发展趋势,由模型Ⅱ的计算结果我们还能够得到各年份处在各年龄段的人口数量、男女比率的预测值。
根据这些预测值我们可以计算出反映人口增长特点的其他指标,由此我们可以对模型的计算结果进行进一步的分析。
2
§3、合理的假设
1、社会稳定,不会发生重大自然灾害和战争bi,si不随时间而变化
2、超过90岁的妇女(老寿星)都按90岁年龄计算
3、在较短的时间内,平均年龄变化较小,可以认为不变
4、不考虑移民对人口总数的影响
§4、名词解释与符号说明
一、名词解释
1、总和生育率——指一定时期(如某一年)各年龄组妇女生育率的合计数,说明每名妇女按照某一年的各年龄组生育率度过育龄期,平均可能生育的子女数,是衡量生育水平最常用的指标之一。
2、更替水平——指这样一个生育水平,同一批妇女生育女儿的数量恰好能替代她们本身。
一旦达到生育更替水平,出生和死亡将逐渐趋于均衡,在没有国际迁入与迁出的情况下,人口将最终停止增长,保持稳定状态。
3、人口抚养比——指人口总体中非劳动年龄人口数与劳动年龄人口数之比。
通常用百分比表示。
说明每100名劳动年龄人口大致要负担多少名非劳动年龄人口。
用于从人口角度反映人口与经济发展的基本关系。
根据劳动年龄人口的两种不同定义(15-59岁人口或15-64岁人口),计算总抚养有两种方式
4、人口老龄化——指人口中老年人比重日益上升的现象。
促使人口老龄化的直接
原因是生育率和死亡率降低,主要是生育率降低。
一般认为,如果人口中65岁及以上
老年人口比重超过7%,或60岁及以上老年人口比重超过10%,那么该人口就属于老年型。
5、出生人口性别比——是活产男婴数与活产女婴数的比值,通常用女婴数量为100时所对应的男婴数来表示。
正常情况下,出生性别比是由生物学规律决定的,保持在103~107之间。
二、符号说明
序号
符号
意义
1:
t
表示年份(选定初始年份的t
0)
2
r
人口增长率
3:
x
人口数量
4:
xm
自然资源和环境条件所能容纳的最大人口数量
5:
R2
可决系数
6:
ni(t),i1,2,
m
在时间段t第i年龄组的人口总数
7:
i
0,1,2,
90)
第i年龄组的生育率
8:
b(i
第i年龄组的死亡率
i
0,1,2,
90)
d(i
9:
si(i
0,1,2,
90)
第i年龄组的存活率
10:
L
Leslie矩阵
11:
Z0
2001
年全国人口总数
12:
zs
2001
年城市总人口
13:
zz
2001
年镇总人口
14:
zx
2001
年乡总人口
3
15:
16:
17:
18:
19:
20:
ni(0),i
1,2,m
2001年第i年龄段的人口总数
vi(i
1,2,3)
i1,2,3时分别表示市、镇、乡的女孩出生率
L(j)
j时段具有劳动能力的人口
(j)
社会的抚养比指数
k
总和生育率
Ki(j)
j时段i年龄组中女性所占的百分比
§5、模型的建立与求解
模型Ⅰ:
阻滞增长模型(Logistic模型)[1]
一、模型的准备
阻滞增长模型的原理:
阻滞增长模型是考虑到自然资源、环境条件等因素对人口增长的阻滞作用,对指数增长模型的基本假设进行修改后得到的。
阻滞作用体现在对人口
增长率r的影响上,使得r随着人口数量x的增加而下降。
若将r表示为x的函数r(x)。
则它应是减函数。
于是有:
dx
r(x)x,x(0)
x0
(1)
dt
对r(x)的一个最简单的假定是,设
r(x)为x的线性函数,即
r(x)rsx(r0,s0)
(2)
设自然资源和环境条件所能容纳的最大人口数量
xm,当x
xm时人口不再增长,即
增长率r(xm)
0,代入
(2)式得s
r
,于是
(2)式为
xm
x
(3)
r(x)r
(1)
xm
将(3)代入方程
(1)得:
dx
rx(1
x)
(4)
dt
xm
x(0)
x0
解方程(4)可得:
x(t)
xm
(5)
(xm
1
1)ert
x0
二、模型的建立
为了对以后一定时期内的人口数做出预测,我们首先从中国经济统计数据库
(http:
//211.86.245.155/index.aspx)上查到我国从1954年到2005年全国总人口的
4
数据如表1。
表1
各年份全国总人口数(单位:
千万)
年份
1954
1955
1956
1957
1958
1959
1960
1961
1962
总人口
60.2
61.5
62.8
64.6
66.0
67.2
66.2
65.9
67.3
年份
1963
1964
1965
1966
1967
1968
1969
1970
1971
总人口
69.1
70.4
72.5
74.5
76.3
78.5
80.7
83.0
85.2
年份
1972
1973
1974
1975
1976
1977
1978
1979
1980
总人口
87.1
89.2
90.9
92.4
93.7
95.0
96.259
97.5
98.705
年份
1981
1982
1983
1984
1985
1986
1987
1988
1989
总人口
100.1
101.65
103.00
104.35
105.85
107.5
109.3
111.02
112.70
4
8
7
1
6
4
年份
1990
1991
1992
1993
1994
1995
1996
1997
1998
总人口
114.33
115.82
117.17
118.51
119.85
121.12
122.38
123.62
124.76
3
3
1
7
0
1
9
6
1
年份
1999
2000
2001
2002
2003
2004
2005
总人口
125.78
126.74
127.62
128.45
129.22
129.98
130.75
6
3
7
3
7
8
6
1、将1954年看成初始时刻即t
0,则1955为t
1,以次类推,以2005年为t51
作为终时刻。
用函数(5)对表1中的数据进行非线性拟合,运用
Matlab编程(程序见
附录1)得到相关的参数xm180.9871,r
-0.0336
,可以算出可决系数(可决系数是判
别曲线拟合效果的一个指标):
5
?
2
(yi
2
yi)
R
1
i
1
0.9959
5
y)2
(yi
i1
由可决系数来看拟合的效果比较理想。
所以得到中国各年份人口变化趋势的拟合曲
线:
x(t)
180.9871
(6)
1(180.98711)e0.0.0336t
60.2
根据曲线(6)我们可以对2010年(t
56)、2020年(t
66)、及2033年(t
79)
进行预测得(单位:
千万):
x(56)138.6161,x(66)
148.5400,x(79)
158.6028
结果分析:
从附录1所给信息可知从1951年至1958年为我国第一次出生人口高峰,形成了中国人口规模“由缓到快”的增长基础;因此这段时期人口波动较大,可能影响
模型结果的准确性。
1959、1960、1961年为三年自然灾害时期,这段时期人口的增长受到很大影响,1962年处于这种影响的滞后期,人口的增长也受到很大影响。
总的来说1951-1962年的人口增长的随机误差不是服从正态分布,
由于上面的曲线拟合是用最小二乘法,所以很难保证拟合的准确性。
因此我们再选择1963年作为初始年份对表1中的数据进行拟合。
2、将1963年看成初始时刻即t0,以2005年为t32作为终时刻。
运用Matlab
5
编程(程序见附录2)得到相关的参数
xm151.4513,r0.0484,可以算出可决系数
R2
0.9994得到中国各年份人口变化趋势的另一拟合曲线:
x(t)
151.4513
(7)
(151.4513
1)e0.0484t
1
69.1
根据曲线(7)我们可以对2010年(t
47)、2020年(t
57)、及2033年(t
70)
进行预测得(单位:
千万):
x(47)134.9190,
x(57)
140.8168,x(70)
145.5908
结果分析:
1963年-1979年其间,人口的增长基本上是按照自然的规律增长,特别是在农村是这样,城市受到收入的影响,生育率较低,但都有规律可寻。
总的来说,人口增长的外界大的干扰因素基本上没有,可以认为这一阶段随机误差服从正态分布;
1980-2005年这一时间段,虽然人口的增长受到国家计划生育政策的控制,但计划生育
的政策是基本稳定的,这一阶段随机误差也应服从正态分布(当然均值与方差可能不同)因此用最小二乘法拟合所得到的结果应有较大的可信度。
3、从1980-2005年,国家计划生育政策逐渐得到完善及贯彻落实,这个时期的人
口增长受到国家计划生育政策的控制,人口的增长方式与上述的两个阶段都不同。
因此
我们进一步选择
1980年作为初始年份2005年作为终时刻进行拟合。
运用Matlab编程
(程序见附录
3)得到相关的参数xm
153.5351,r0.0477,可以算出可决系数
R2
0.9987得到中国各年份人口变化趋势的第三条拟合曲线:
x(t)
153.5351
(8)
1(153.53511)e0.0477t
98.705
根据曲线(7)我们可以对2010年(t
30)、2020年(t
40)、及2033年(t
53)
进行预测得(单位:
千万):
x(30)135.5357,x(40)
141.8440,x(53)
147.0172
结果分析:
这一时期,国家虽然对人口大增长进行了干预,但国家的计划生育的政策是基本稳定的,在此其间没有其他大的干扰,所以人口增长的随机误差应服从正态分布。
所以我们的结果应是比较可信的。
我们分别根据拟合曲线(6)、(7)、(8)对各年份中国总人口进行预测得到结果如
表2:
表2各年份全国总人口用不同拟合曲线预测数(单位:
千万)
全国总人口预测(单位:
千万)
年份
预测曲线(6)预测曲线(7)预测曲线(8)
2000
126.7649
126.3338
126.473
2003
130.5141
129.2303
129.5168
2006
134.1
131.8447
132.2758
2009
137.516
134.1926
134.7638
2012
140.7577
136.2917
136.9971
2015
143.8231
138.1607
138.9933
2018
146.7117
139.819
140.771
2021
149.4251
141.2856
142.3489
2024
151.9662
142.579
143.7452
6
2027
154.3392
143.7168
144.9778
2030
156.5494
144.7157
146.0632
2033
158.6028
145.5908
147.0172
2036
160.5063
146.3562
147.8541
2039
162.267
147.0247
148.5871
2042
163.8924
147.6077
149.2284
2045
165.3903
148.1158
149.7886
2048
166.7683
148.558
150.2775
由上表可以看出:
用拟合曲线(6)预测得到的数据比较大,在2024年总人口就已经超过了151.9662千万,而且一直以比较快的速度增长到2048年达到了166.7683千万。
用拟合曲线(7)预测得到的数据偏小,到2048年人口只有148.558千万。
相比较而言用拟合曲线(8)预测的数据比较接近附件1中的预测。
画出图形如图1:
对各年份全国总人口的预测
数
口180
预测曲线(6)
人170
预测曲线(7)
160
预测曲线(8)
150
140
130
120
110
100
年份
00
06
12
18
24
30
36
42
48
20
20
20
20
20
20
20
20
20
图1:
对各年份全国总人口数的预测
模型Ⅱ:
按年龄分布的Leslie模型[2]
一、模型的准备
将人口按年龄大小等间隔地划分成m个年龄组(譬如每10岁一组),模型要讨论在不同时间人口的年龄分布,对时间也加以离散化,其单位与年龄组的间隔相同。
时间离
散化为t0,1,2
.设在时间段t第i年龄组的人口总数为
ni(t),i1,2,m,定义向量
n(t)[n1(t),n2(t),
nm(t)]T,模型要研究的是女性的人口分布
n(t)随t的变化规律,从而
进一步研究总人口数等指标的变化规律。
设第i年龄组的生育率为bi,即bi是单位时间第i年龄组的每个女性平均生育女儿的人数;第i年龄组的死亡率为di,即di是单位时间第i年龄组女性死亡人数与总人数之
比,si
1
di称为存活率。
设bi、si不随时间t变化,根据bi、si和ni(t)的定义写出ni(t)
与ni(t
1)
应满足关系:
m
ni(t1)
bini(t)
(9)
i1
ni1(t1)
sini(t),i1,2,
m1
7
在(9)式中我们假设bi中已经扣除婴儿死亡率,即扣除了在时段t以后出生而活不
到t
1的那些婴儿。
若记矩阵
b1
b2
bm1bm
s1
0
0
L0
s2
(10)
00sm10
则(9)式可写作
n(t1)Ln(t)
(11)
当L、n(0)已知时,对任意的t1,2,有
n(t)
Ltn(0)
(12)
若(10)中的元素满足
(ⅰ)si
0,i
1,2,
m1;
(ⅱ)bi
0,i
1,2
m,且至少一个bi
0。
则矩阵L称为Leslie矩阵。
只要我们求出Leslie矩阵L并根据人口分布的初始向量
n(0),我们就可以求出t时
段的人口分布向量n(t)。
二、模型的建立
我们以2001年为初始年份对以后各年的女性总数及总人口数进行预测,
根据附件2
中所给数据,以一岁为间距对女性分组。
(1)
计算2001年处在各个年龄上的妇女人数的分布向量
ni(0),(i0,1,2,
90):
附件2给了2001年中国人口抽样调查数据,提取为表
3
表3
城市男
147907
城市女
147465
镇男
80279
镇女
77976
乡男
394690
乡女
372242
根据抽样调查的结果,可以算出2001年城市、镇、乡人口占2001年全国总人口的比率分别为:
ps0.242,pz0.1297,px
0.6283
我们由表1数据知2001年全国总人口Z0127.
627(单位:
千万),因此可以算出
2001年城市、镇、乡的总人口分别为(单位:
千万):
zspsz030.885、zzpzz016.
548、zxpxz080.194
根据附件2给的2001年城市、镇、乡各个年龄段的女性比率,可以分别算出2001
年城市、镇、乡处在第i(i0,1,2,,90)年龄段的女性的总数分别为n1i(0),n2i(0),n3i(0)。
以城市为例,设2001年城市