基于BP神经网络和GM11灰色模型的中国人口预测分析.doc

上传人:wj 文档编号:528272 上传时间:2023-04-29 格式:DOC 页数:22 大小:2.05MB
下载 相关 举报
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第1页
第1页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第2页
第2页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第3页
第3页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第4页
第4页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第5页
第5页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第6页
第6页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第7页
第7页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第8页
第8页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第9页
第9页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第10页
第10页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第11页
第11页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第12页
第12页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第13页
第13页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第14页
第14页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第15页
第15页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第16页
第16页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第17页
第17页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第18页
第18页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第19页
第19页 / 共22页
基于BP神经网络和GM11灰色模型的中国人口预测分析.doc_第20页
第20页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

基于BP神经网络和GM11灰色模型的中国人口预测分析.doc

《基于BP神经网络和GM11灰色模型的中国人口预测分析.doc》由会员分享,可在线阅读,更多相关《基于BP神经网络和GM11灰色模型的中国人口预测分析.doc(22页珍藏版)》请在冰点文库上搜索。

基于BP神经网络和GM11灰色模型的中国人口预测分析.doc

基于BP神经网络和GM(1,1)灰色模型的中国人口预测分析

黄俸强李晶邓健萍

摘要

人口预测对国民经济的发展有着非常重要的作用.如何用操作性强,可信度高的方法来预测人口的变化,这是一个值得探讨的问题.

本文主要根据《中国人口统计年鉴》上收集到的2001年到2005年部分数据,在灰色预测的基础上,引入BP神经网络模型,建立了中国人口增长的GM(1,1)和BP神经网络组合模型,并由此对中国人口增长的中短期和长期趋势做出预测.

我们通过输入原始数据资料,应用灰色模型进行预测,得到预测数列,然后将预测值作为输入量,原始数据作为期望值,对BP神经网络进行训练,得到相应的权值和阀值,最后输入预测年份,即可得到具有较高精度的预测量.由此可以知道,中国人口增长的中短期和长期趋势为:

人口总量在中短期内继续增长,增速较为平稳,每年以0.11亿人口数增长.人口总量在未来30年还将净增2亿人左右,总人口将于2010年,2020年分别达到13.63亿人和14.67亿人,2033年前后达到峰值15.01亿人,之后人口总量缓慢下降.

我国育龄妇女(15-49岁)人数在短期内持续增加,在2014年达到顶峰,之后开始缓慢下降,到2033年左右,下降速度加快;我国生育旺盛期育龄妇女(20-29岁)人数在短期内持续下降,在2015年达到低谷,之后开始缓慢回升,但是一段时期后,又开始缓慢下降,如此波动变化.

全国人口死亡率继续保持较低水平(维持在7‰以下),并缓慢下降,从1990年的6.67‰下降到2050年的5.66‰,减少了1.01个千分点;我国男性人口死亡率高于女性人口死亡率,乡人口死亡率高于城镇人口死亡率.

我国人口城镇化速度在未来20年里每年增长1.10-1.50个百分点,之后人口城镇化开始放慢增长速度,2021-2050年间仅增加11.41个百分点.到本世纪中叶,城镇化水平在75%左右.

2005年我国老年人口已超过1亿人,到2020年,65岁以上老年人口将达到1.74亿人,比重从2005年的8.09%增长到12.02%.预计2050年,65岁以上老年人口达3.38亿多人,比重达23.23%.老龄化进程加速.老年人口数量多,老龄化速度快,高龄趋势明显.

出生人口性别比总体呈上升趋势.中短期变化不大,都在初始值附近波动;从2010年到2050年平均每年增长了0.75.

此组合模型兼有灰色预测和BP神经网络预测的优点,既利用灰色系统理论具有所需要的样本数据少,原理简单,运算方便,短期预测精度高,可检验等优点,也发挥神经网络并行计算,容错能力强,自适应能力强等优点,模型既克服了原始数据少,数据波动性大对预测精度的影响,也增强了预测的自适应性.

关键词:

BP神经网络GM(1,1)灰色预测模型人口预测

一,问题重述

1.1,问题背景

中国自古以来是一个人口大国.新中国成立后,我国人口进入飞速发展阶段.1949年到1957年8年时间,人口增长了1亿;1964年总人口超过7亿,1969年总人口超过8亿,1974年总人口超过9亿.这一时期每增长1亿人时间间隔为5年.中国人口净增长率波动比较剧烈.80年代以后,由于我国实行了计划生育,人口膨胀得到了有效的控制.实行近30年来,使我国少生了4亿多人,为中国现代化建设,全面实现小康社会打下了坚实的基础,同时也为世界人口控制做出了杰出贡献.但是由于中国人口基数大,人口增长问题依然十分严峻.

在我国现代化进程中必须实现人口与经济,社会,资源,环境协调发展和可持续发展,而人口问题始终是制约我国发展的关键因素之一.要发展,必须进一步控制人口数量,提高人口质量,改善人口结构.对中国未来人口的准确预测,能够为中国经济和社会发展的重大决策提供科学依据,这对加速推进我国现代化建设有着极为重要的现实意义.因此,根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重要问题.

1.2,问题提出

近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速,出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长.2007年初发布的《国家人口发展战略研究报告》(附录1)还做出了进一步的分析.

关于中国人口问题已有多方面的研究,并积累了大量数据资料.现在得到了《中国人口统计年鉴》上收集到的部分数据(见附录2).其中包含2001至2005年的市,镇和乡人口不同性别的人在该类人口中所占的百分比,死亡率,生育率,每年人口抽样调查的样本容量(人数)数据.1994至2005年的市,镇和乡男女出生比例.1995至2005年的市,镇和乡育龄妇女生育率的千分比(‰).

根据已知数据(或搜索相关文献和补充新的数据),解决以下的问题:

从中国的实际情况和人口增长的上述特点出发,建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测.

二,问题的分析

一个国家人口的准确预测,是制定相应宏观经济政策的重要依据,对我国经济的发展有着巨大的作用.预测是控制和规划的基础,预测的精度是控制和规划成功的前提,而选择预测的方法是提高预测精度的关键.传统的人口预测方法主要有逻辑方法,常微分方程方法和动态预测方法等.这些方法在人口预测领域起到了一定的作用,但采用这些方法时都要对数据进行模型假设.由于真实模型往往是非线性的,如果在一些简单的模型假设下就进行数据模拟,常常不能达到较好的模拟效果.神经网络对复杂非线性系统具有曲线拟合能力,基于BP神经网络和GM(1,1)模型的组合模型进行动态预测.既利用灰色预测的需要数据资料少的优点,又吸收了BP神经网络容错能力,自适应能力强的优点.由于神经网络的功能之强大,型式之多样,若能将其它网络形式同灰色模型相结合,则有可能进一步提高预测精度.

三,模型的假设与符号说明

3.1,模型假设与约定

(1)未来人口的死亡模式保持不变;

(2)所研究的人口为封闭人口;

(3)农村人口一旦迁入城镇或者城镇化,其人口行为和特征即与城镇人口相同,即忽略城镇人口与迁入城镇人口或城镇化人口的差别.

(4)人口数据质量高,无误报和漏报等.

(5)在分析老年人口问题时,是以65岁作为老年人口的起点年龄;

3.2,名词定义

主要统计指标解释

人口数指一定时点,一定地区范围内有生命的个人总和.

出生率指在一定时期内(通常为一年)一定地区的出生人数与同期内平均人数(或期中人数)之比,用千分率表示.其计算公式为:

死亡率指在一定时期内(通常为一年)一定地区的死亡人数与同期内平均人数(或期中人数)之比,用千分率表示.其计算公式为:

人口自然增长率是指在一定时期内(通常为一年)人口自然增加数(出生人数减死亡人数)与该时期内平均人数(或期中人数)之比,用千分率表示.计算公式为:

预测时期短期(<10年),中期(10-25年),长期(>25年);

出生人口性别比是活产男婴数与活产女婴数的比值,通常用女婴数量为100时所对应的男婴数来表示.正常情况下,出生性别比是由生物学规律决定的,保持在103~107之间.

人口抚养比指人口总体中处于供养年龄(一般指15岁以下和64岁以上)的人口与处于“经济活动”年龄(15-64岁)人口的比率.用百分铝表示.计算公式为:

总和生育率:

一定时期(如某一年)各年龄组妇女生育率的合计数,说明每名妇女按照某一年的各年龄组生育率度过育龄期,平均可能生育的子女数,是衡量生育水平最常用的指标之一.

四,模型的建立和求解

4.1,GM(1,1)预测模型的基本原理

(1)GM(1,1)灰色系统[1]

所谓灰色系统是指既含有已知信息,又含有未知信息的系统,是由邓聚龙教授在1986年提出的.灰色理论自诞生以来,发展很快,由于它所需因素少,模型简单,特别是对于因素空间难以穷尽,运行机制尚不明确,又缺乏建立确定关系的信息系统,灰色系统理论及方法为解决此类问题提供了新的思路和有益的尝试.

灰色预测方法是根据过去及现在已知的或非确知的信息,建立一个从过去引申到将来的GM模型,从而确定系统在未来发展变化的趋势,为规划决策提供依据.在灰色预测模型中,对时间序列进行数量大小的预测,随机性被弱化了,确定性增强了.此时在生成层次上求解得到生成函数,据此建立被求序列的数列预测,其预测模型为一阶微分方程,即只有一个变量的灰色模型,记为GM(1,1)模型.

灰色GM(1,1)预测模型在计算过程中主要是以矩阵为主,它和MATLAB的结合可以有效的解决了灰色系统理论在矩阵计算中的问题,为灰色系统理论的应用提供了一种新的方法.

(2)GM(1,1)预测模型的基本原理

GM(1,1)模型是灰色预测的核心,它是一个单个变量预测的一阶微分方程模型,其离散时间响应函数近似呈指数规律.建立GM(1,1)模型的方法是:

设为原始非负时间序列,为累加生成序列,即

(1)

GM(1,1)模型的白化微分方程为:

(2)

(2)中,为待辨识参数,亦称发展系数;为待辨识内生变量,亦称灰作用量.设待辨识向量,按最小二乘法求得式中

于是可得到灰色预测的离散时间响应函数为:

(3)

为所得的累加的预测值,将预测值还原即为:

(4)

(3)GM(1,1)预测模型的MATLAB程序

根据上述GM(1,1)模型的数学思想,结合MATLAB语言的特点编制了一套可读性强,容易理解的预测程序.该程序操作简单灵活,稳定性好,直接面向用户.

4.2,BP神经网络模型的基本原理

(1)神经网络的定义简介[2]

神经网络是由多个神经元组成的广泛互连的神经网络,能够模拟生物神经系统真实世界及物体之间所做出的交互反应.人工神经网络处理信息是通过信息样本对神经网络的训练,使其具有人的大脑的记忆,辨识能力,完成名种信息处理功能.它不需要任何先验公式,就能从已有数据中自动地归纳规则,获得这些数据的内在规律,具有良好的自学习,自适应,联想记忆,并行处理和非线性形转换的能力,特别适合于因果关系复杂的非确定性推理,判断,识别和分类等问题.对于任意一组随机的,正态的数据,都可以利用人工神经网络算法进行统计分析,做出拟合和预测.

基于误差反向传播(Backpropagation)算法的多层前馈网络(Multiple-layerfeedforwardnetwork,简记为BP网络),是目前应用最成功和广泛的人工神经网络.

(2)BP模型的基本原理[3]

学习过程中由信号的正向传播与误差的逆向传播两个过程组成.正向传播时,模式作用于输入层,经隐层处理后,传入误差的逆向传播阶段,将输出误差按某种子形式,通过隐层向输入层逐层返回,并“分摊”给各层的所有单元,从而获得各层单元的参考误差或称误差信号,以作为修改各单元权值的依据.权值不断修改的过程,也就是网络学习过程.此过程一直进行到网络输出的误差准逐渐减少到可接受的程度或达到设定的学习次数为止.BP网络模型包括其输入输出模型,作用函数模型,误差计算模型和自学习模型.

BP网络由输入层,输出层以及一个或多个隐层节点互连而成的一种多层网,这种结构使多层前馈网络可在输入和输出间建立合适的线性或非线性关系,又不致使网络输出限制在-1和1之间.见图

(1).

输入层

输出层

隐含层

……

……

……

P1X1

P2

P3

Pn

图1BP网络模型

OOOO

(大于等于一层)W

(1)…W(L)

(3)BP神经网络的训练

BP算法通过“训练”这一事件来得到这种输入,输出间合适的线性或非线性关系.“训练”的过程可以分为向前传输和向后传输两个阶段:

[1]向前传输阶段:

①从样本集中取一个样本,将输入网络;

②计算出误差测度和实际输出;

③对权重值各做一次调整,重复这个循环,直到.

[2]向后传播阶段——误差传播阶段:

①计算实际输出与理想输出的差;

②用输出层的误差调整输出层权矩阵;

③;

④用此误差估计输出层的直接前导层的误差,再用输出层前导层误差估计更前一层的误差.如此获得所有其他各层的误差估计;

⑤并用这些估计实现对权矩阵的修改.形成将输出端表现出的误差沿着与输出信号相反的方向逐级向输出端传递的过程.

网络关于整个样本集的误差测度:

4.3,应用步骤

(1)输入原始数据资料;

(2)应用灰色模型进行预测,得到预测序列;

(3)将预测值作为输入量,原始数据作为期望值,对BP神经网络进行训练,得到相应的权值和阀值;

(4)输入需要预测的年份,即可得到具有相当精度的预测量.

4.4,预测与结果分析

(1)未来我国总人口变化情况

通过查询中国人口与发展研究中心在中国人口信息网上所公布的数据,获知我国1996—2005年的人口总数,出生率和死亡率数据.

根据此数据,应用灰色模型预测我国未来10年人口总数,出生率和死亡率,将其作为训练样本(输入量),1990—2005年的原始数据作为检验样本(期望值),对BP神经网络进行训练.

在此基础上,对我国未来45年人口总数进行预测.并且我们还分别使用单独的GM(1,1)模型和BP神经网络模型对中国未来45年人口总数进行预测,预测数据见下表[4],每年详细数据见附录表1.

表12001-2050年全国总人口变动情况预测

单位(亿人)

GM(1:

1)模型

BP神经网络

GM(1,1)和BP神经网络组合

国家2003人口计生委预测结果(TFR=1.8)

1996

12.1924

12.2389

12.2389

1997

12.2976

12.3626

12.3626

1998

12.4037

12.4761

12.4761

1999

12.5107

12.5786

12.5786

2000

12.6187

12.6743

12.6743

2001

12.7276

12.7627

12.7627

12.87

2002

12.8374

12.8453

12.8453

12.97

2003

12.9482

12.9227

12.9227

13.06

2004

13.06

12.9988

12.9988

13.15

2005

13.1727

13.0756

13.0756

13.24

2006

13.1727

13.157

13.1727

13.33

2007

13.2864

13.2489

13.2864

13.42

2008

13.401

13.3427

13.401

13.51

2009

13.5167

13.4366

13.5167

13.61

2010

13.6333

13.5283

13.6333

13.7

2011

13.751

13.6154

13.751

13.8

2012

13.8696

13.6961

13.8696

13.9

2013

13.9893

13.7688

13.9893

14

2014

14.1101

13.8328

14.1101

14.1

2015

14.2318

13.8878

14.2318

14.19

2020

14.8566

14.0449

14.6775

14.54

2025

15.5088

14.0677

14.9131

14.73

2030

16.1897

14.0016

15.0007

14.83

2035

16.9004

13.8538

15.0117

14.86

2040

17.6424

13.6642

14.981

14.83

2045

18.4169

13.5188

14.9205

14.68

2050

19.2254

13.4470

14.8381

14.4000

将所得数据制成图表,如下图所示

图2未来我国总人口预测图

按此预测,从以上图表中可以知道我国人口增长的中短期和长期趋势为:

中国人口自然增长率继续保持平稳下降,人口总量在中短期内继续增长,增速较为平稳.人口总量在未来30年还将净增2亿人左右,总人口将于2010年,2020年分别达到13.63亿人和14.67亿人,2033年前后达到峰值15.01亿人,之后人口总量缓慢下降.

对比国家人口计生委2003年预测结果,单独的GM(1,1)模型和神经网络模型都能非常精确的预测出在短期内我国未来人口总数,在中期预测中,也能较好的反映出人口变化趋势.在长期预测时,GM(1,1)的预测数据偏差非常大,神经网络虽然变化趋势较符合我国未来人口变化情况,但偏差还是较大.而组合模型在这三个时期内,都能够很好的预测出中国未来人口总量的及其变化情况.显然组合模型的预测效果最佳.关于GM(1,1)长期预测的局限性将在模型评价中讨论.

(2)妇女生育水平变化情况

根据题中附录1的数据,利用组合模型分别预测出未来全国育龄妇女人数变化情况及未来我国生育旺盛期育龄妇女(20-29岁)人数预测,结果见下图

图3.1未来我国育龄妇女(15-49岁)人数预测

图3.2未来我国市镇乡育龄妇女(15-49岁)人数预测

图3.3未来我国生育旺盛期育龄妇女(20-29岁)人数预测

图3.4未来我国市镇乡生育旺盛期育龄妇女(20-29岁)人数预测

未来我国育龄妇女(15-49岁)人数在短期内持续增加,在2014年达到顶峰,之后开始缓慢下降,到2033年左右,下降速度加快.

相反,我国生育旺盛期育龄妇女(20-29岁)人数在短期内持续下降,在2015年达到低谷,之后开始缓慢回升,但是一段时期后,又开始缓慢下降,如此波动变化.

由表3.2和表3.4可知城市面临生育水平降低农村则一直持续较高的生育水平.

(3)人口死亡率变化情况

人口死亡水平是造成人口数量和结构变化的重要因素之一,随着我国社会经济的迅速发展医疗卫生条件的进一步改善我国人口的健康水平有了明显改善,人口的死亡率较低.

利用组合模型对人口死亡率变化情况进行预测.所得结果下图

图4.1全国人口死亡率预测

图4.2全国城市男女死亡率预测

图4.3全国镇男女死亡率预测

图4.4全国乡男女死亡率预测

由上图4.1可以知道,全国人口死亡率继续保持较低水平(维持在7‰已下),并缓慢下降,从1990年的6.67‰下降到2050年的5.66‰,减少了1.01个千分点.

从上图4.2,4.3,4.4可以知道,我国男性人口死亡率高于女性人口死亡率,乡人口死亡率高于城镇人口死亡率.

(4)城镇化水平变化情况;

城镇人口比重是衡量经济发展水平特别是工业发展水平的重要标志,随着我国改革开放和经济建设的发展,城镇化水平有了较大提高.

可预测城镇化水平变化情况,如下表所示,详细数据,请见附录表2

年份

人口城镇化

年份

人口城镇化

年份

人口城镇化

2010

52.27

2025

66.53

2040

73.99

2015

59.17

2030

68.57

2045

75.65

2020

65.07

2035

71.41

2050

76.48

表22001-2050年我国人口城镇化水平变化趋势

图52001-2050年我国人口城镇化水平变化趋势

可以知道我国人口城镇化速度在未来20年里每年增长1.10-1.50个百分点,之后人口城镇化开始放慢增长速度,2021-2050年间仅增加11.41个百分点.到本世纪中叶,城镇化水平在75%左右,达到中等发达国家城镇化水平.

(5)老龄化人口问题

随着人口年龄结构的不断老化,人口年龄结构的类型就会从年轻型进入成年型,最后进入老年型,我国人口年龄结构的变化也是经过了不同类型的变化.从2000年开始我国65岁以上人口占总人口的比重达到7%,14岁人口比例为22.9%,老少比为30.4%,年龄中位数为30.8岁表,这就意味着我国即将开始进入老龄社会.

根据中国人口与发展研究中心在中国人口信息网上所公布的数据,获知我国2001—2005年的老年人口总数.见下表3

表3我国2001—2005年的老年人口数据

2001

2002

2003

2004

2005

65岁以上人口数(亿人)

0.91

0.94

0.96

0.98

1.01

人口老龄化程度(%)

7.09

7.24

7.36

7.48

7.61

分别使用GM(1,1)和组合模型,对老龄化情况作出预测,其结果见下图5.1,5.2

图6.1我国未来65岁以上人口数预测

图6.2我国未来人口老龄化程度预测

图6.3我国城市人口年龄结构预测

图6.4我国镇人口年龄结构预测

图6.5我国乡人口年龄结构预测

2005年我国老年人口已超过1亿人,到2020年,65岁以上老年人口将达到1.74亿人,比重从2005年的8.09%增长到12.02%.预计2050年,65岁以上老年人口达3.38亿多人,比重达23.23%.老龄化进程加速.老年人口数量多,老龄化速度快,高龄趋势明显.

人口老龄化将导致抚养比不断提高,尤其是乡老年人口变化显著,50年增加了30多个百分点.

老年人口比重的不断提高和老年人口绝对数的大量增加,在如何搞好老年人口的衣食住行和老有所养,老有所乐,老有所为等方面是国家和社会不容忽视的问题.

(6)出生人口性别比问题(持续升高)

中国出生人口性别比自1984年开始失调,伴随着出生人口性别比异常升高的速度从缓慢到加速,失调从轻度到重度,因而对于出生人口性别比的预测就显得相当重要.

由组合模型和题中附录1中1995-2005年的数据,对出生人口性别比问题进行预测,所得结果如下图(图7)所示,详细数据查看附录表3.

图72006-2043年全国城,镇,乡出生人口性别比变动趋势

出生人口性别比呈上升趋势.城乡失

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2