建立中国人口增长的数学模型,并由此预测人口增长的中短期及长期趋势,本文的工作主要包括以下四个方面:
一是建模前的准备:1)与现实情况比较,对附件中数据进行了预处理;2)利用题给及辅助数据,选取①乡村人口城镇化、②出生人口性别比、③人口老龄化趋势三个指标进行分析,①和③的分析方法是直接对附件中数据图像处理,②是通过参数假设检验与回归方法分析市、镇、乡性别比的现状及短期发展趋势。
二是建立了两个预测模型:针对总人口的预测问题,建立了基于GM(1,1)预测方法的递推模型,利用附件中的数据,首先预测出以后各年的出生率和死亡率,结合这些数据计算出这一年的总人口数,进而递推出下一年总人口数。其中,在对死亡率预测模型精度的检验中,其相对误差仅0.744%、关联度为0.99趋近于1。考虑到各个年龄段人口的不同特点,通过对题中信息分析整合,绘制各年龄段人口变化曲线,发现各年龄段人口随时间向后存在推移效应,据此,建立了时间推移模型,并进行纵坐标平均差分析,得到的平均差数据均在0.1以下。随后,用递推模型分析指标①、②的未来趋势,反映出问题将越来越严峻;用时间推移模型分析③得到老龄人口比率的变化趋势,即老龄化进程将随时间有所加快。
三是定义了所谓“时序滑动样本均方差”指标,据此探讨了人口总量、老龄人口的波动问题,结果表明单从避免人口数量“大起大落”因素考量现行人口政策的平稳性效果很好。这为在确保人口总量平稳下降、通过社保建设提高老龄化承受力方面的思考与决策,提供了一条途径和辅助分析依据。
四是在上述分析与预测的基础上,考虑到通过降低生育率而减少人口数与减缓老龄化的矛盾因素,我们对此两个指标,分别引入有效控制函数和政府对老龄化趋势的控制力度系数,建立了兼顾这两个指标是的优化模型,并在改善人口构成特点方面提出了相关建议。
模型的优点表现有三:其一,我们的结论建立在对数据科学分析的基础上,反映了客观实际因而增强了说服力,例如通过参数假设检验说明初生人口性别比的结论。其二,在建立递推预测模型后,及时对该模型的精度进行了检验,确保了模型的适用性和结果的可信性。其三,在对人口增长趋势进行预测后,我们引入政府控制力度,表现了政府采取的措施对人口增长的控制作用,调节控制了人口的增长趋势。
不足之处是对人口素质没有涉及,例如通过提高人口素质改变人们的生育观念进而降低初生人口性别比、生育率水平就值得探讨;辅助数据的数量与广度也有待扩大,样本的这个局限不能使所用方法与所建模型增色;在有效控制函数中引入的参数难以准确定量;此外,写作方面也存在不少粗糙之处。
关键词:GM(1,1)模型时间推移模型回归分析参数假设检验
时序滑动样本均方差政府对老龄化趋势的控制力度系数
有效控制函数
二、问题重述与分析
我国作为人口大国,人口问题一直是制约我国发展的重要因素,本题要求对中短期和长期的中国人口增长趋势作出预测和分析。对题中涉及的中短期和长期的概念,我们理解为:短期预测约为5年,中期预测一般是向前预测15年至20年,长期预测是指30至50年以上的预测。
我们所需要做的有以下三项工作:
1、对我国人口的增长情况进行预测;
2、根据预测的我国人口的增长趋势,对我国的人口特点进行分析;
3、根据人口增长趋势状况,对如何解决人口增长问题,调整人口特点进行研究。
由于影响人口增长的因素,如:出生率,死亡率都是随机的,无法准确预测,所以此模型预测问题带有不确定性,至少需要用不确定性方法求解。对于人口增长趋势的分析,我们主要关心的是人口结构老龄化、出生男女性别比例失调、乡村人口城镇化此三项考察指标,为了解决中国人口问题,需要利用这些指标,建立相应的目标函数,对如何有效控制人口增长,解决人口问题进行探讨,方便对人口发展进行预测和控制,作出决策提供一定的参考依据。
三、模型的假设和符号说明
1、假设:
(1)将所研究的社会人口作为一个整体,当作一个系统;
(2)所以表征和影响人口变化的因素都是在整个社会人口平均意义下定义的;
(3)自然状态下影响人口变化的因素有:时间的流逝,婴儿的出生,人口的死亡和国民的迁移,但在这里为简化模型。我们仅考虑出生率和死亡率。
2、符号说明:由于符号较多,在以后的模型中具体给出。
四、人口预测模型的分析与建立
(一)建模前的预备分析工作
1、 对数据的预处理:
通过对附件2的数据进行分析,对于2005年,我们发现中国1%的人口有16985767人,说明中国2005年的人口总数约为16.9亿,这是不符合中国的实际情况的,对于2003年的出生率远小于其它的各年的出生率,且通过查资料得到2003年的人口增长率超过了1%,因此我们把它当成奇异数据,将2003年的人口出生率人为的扩大10倍,使其满足我国的实际情况,
2、 对数据分析工作:
由附表,得到我国人口的一些特点,主要从以下几个方面进行说明:
(1)乡村人口城镇化
将2001年到2005年的市、镇、乡的男女人口总数分别求出,得到如图1所示:
图12001年到2005年的市、镇、乡的男女人口比例
由图1可以看出从2001年到2005年市、镇人口逐年增加,乡村人口逐年减少。这说明了我国乡村人口城镇化的一个趋势和事实。
(2)对城、镇、乡的初生人口性别比的假设检验与趋势分析:
1) 对城、镇、乡的初生人口性别比的假设检验
① 正常情况下,初生人口性别比是由生物学规律决定的,保持在103 ~ 107之间。
② 初生人口性别比受到众多随机因素的影响,并且各因素均非决定性的影响因素,根据大数定理,可以假定初生人口性别比服从均值为103~ 107之间的某个数的正态分布。
③ 分别对于城、镇、乡的初生人口性别比,讨论如下检验问题
取显著性水平 ,利用题目附件给的1994-2005年的数据进行计算,得到检验统计量的对应值为8.8325、6.3082、21.1871,与T分布的上分位点 3.1058比较。可见,对应值均大于上分位点,因而拒绝原假设,认为1994-2005年的初生人口性别比并非仅由生物学规律决定,而是受到了人为因素的影响。
类似,对于城、镇、乡的初生人口性别比,讨论另一个检验问题
不难得到检验结论为:接受原假设 。当然,后一个检验问题可以根据前一个检验问题的结论省略。
2) 对城、镇、乡的初生人口性别比趋势的回归分析
用附件1中的1994-2005年的数据(缺2000年数据),由初生人口性别比对年份1到12进行回归,结果如图2所示(从上到下按城、镇、乡排列):
图2城、镇、乡的初生人口性别比趋势的回归分析图
说明:纵坐标表示女生生育100人的时候,男性的生育数据。
一元线性回归的结果的回归直线斜率分别为0.1051、0.0843、0.4357,可见,城、镇、乡的初生人口性别比趋势是乡的上升更快。
3)结论
通过上述检验和分析,可以得到如下结论:初生人口性别比正在人为因素的受到影响,重男轻女的思想观念使得初生人口性别比越来越大,乡村的情况更加严重,长此以往必然产生巨大的社会问题。
对1995-2005年城、镇、乡育龄妇女生育率同样作线性回归,得到回归直线依次为:
说明:t表示年份对应的序列1—11(1994—2005缺2000)
可见,斜率均为负,反映了通过政府和人民的多年努力育龄妇女生育率在不断下降(这是成绩),但也不平衡,乡的对应回归直线的斜率绝对值最小,进一步下降的潜力最大。
分析与预测的结果为政府决策提供参考,使全社会明确努力方向(比如说,加强乡村养老保障建设,消除乡村人民的后顾之忧,降低育龄妇女生育率)。
(3) 人口的老龄化趋势
由附件1,60岁或者65岁以上者为老年人,在此以65岁为例进行分析说明,通过对附件2中的市、镇、乡的65岁以上的男女比率分别进行统计得到如图3所示的结果:
图3市、镇、乡的65岁以上的男女比率
由图中的结果发现:城市的老年人2003后逐渐减少,而镇、乡的老年人从2001年到2005年都是呈增长趋势的,这证明了附件1中的,由于农村的养老保障制度不健全,青壮年人口大量流入城市,使农村老龄化趋势越来越严峻,另一方面也说明了,我国人口总的趋势是老龄化进程加速。
当然,中国人口增长的特点并不仅限于此,还有一些许多的因素由于数据有限,这里就不再给予说明。
(二)模型的建立
模型一:基于GM(1,1)预测的递推模型(总人口)
1、模型的分析
由于题中所给人口数据样本仅2001—2005年,所给信息不全,又考虑到影响人口增长的主要因素有出生率和死亡率,人的出生与死亡是随机事件,无法准确预测,而灰色系统理论着重研究“小样本,贫信息,不确定”问题,是常用的不确定性系统研究方法,具有能够利用“少数据”建模寻求现实规律的良好特性,克服了本题资料不足、问题随机性因素较大,系统周期短的矛盾,适合本题时间数据累计较少(五年)预测条件。又因为此问题所包含的为以单变量,所以建立GM(1,1)模型对出生率与死亡率进行预测。
2、参数的设定
将所有人口划分为6类(用 表示各类人),91个年龄段(用 表示各年龄段)
: ——城市女; ——镇女;——乡女;
——城市男; ——镇男; ——乡男;
:0——0岁, … ,90——90+岁;
对固定某一年
:第 类人第 年龄段人所占此类男女总人口的百分比;
:第 类人第 年龄段死亡人数所占该年龄段人口的千分比;
:第 年龄段生育子女妇女数所占该年龄段妇女人数的千分比;
:第 类人口总数;
3、模型的建立
首先,根据附表中01-05年的数据,用统计的方法得出各年的出生的总人数,则死亡率:
1)用市、镇、乡各个年龄段男女分别所占的比率各个对应类别的人的死亡率,即分别求得市、镇、乡第t年第i岁的男女的分别的死亡率。
2)将上述所求的死亡率 对应第t年的市、镇、乡的男女人数,即得到市、镇、乡的男女的死亡人数。
3)用上述的死亡人数/第t年调查的总人数,即得到(1)式
4)用上述3个步骤,对市、镇、乡的15岁到49岁的妇女的生育率做同样的处理,即可得到在育龄期间的第t年的婴儿的出生率(2)式:
对于封闭的人口系统,第k年的人口量
建立GM(1,1)模型,预测死亡率,具体计算步骤如下:
第一步:往年的死亡率原始时间序列
作一次累加生成运算,用公式
得到一次累加生成序列
第二步:确定数据矩阵
和
代入B, ,用最小二乘法估计参数
第三步,建立死亡率预测模型,解一阶线性微分方程
得时间响应函数为:
第四步 ,模型精度的检验
①残差检验:用时间响应函数计算 ,并计算还原数据 ,求出各时期残差值 和相对误差值。计算结果如表1:
表1 残差检验
K | |||||
2002年 | 0.012123 | 0.006192 | 0.00624 | 0.000048 | 0.776009 |
2003年 | 0.018312 | 0.006189 | 0.006097 | -0.000091 | -1.504956 |
2004年 | 0.024498 | 0.006185 | 0.006223 | 0.000038 | 0.613426 |
2005年 | 0.03068 | 0.006182 | 0.006187 | 0.000005 | 0.083293 |
由上表可看出,此模型相对误差不超过 2% 。
②后验差检验:原始数据
求出 的均值 = ;方差 =
再求出残差数据 的均值 =
方差 =
则后验差比值0.4858
小概率误差0.75
③关联度检验:
计算灰色绝对关联度
其中
得到 0.9999
表2 模型检验等级参照表
指标临界值 精度等级 | 相对误差 | 关联度 | 均方差均值 | 小误差概率 |
一级(好) | 0.01 | 0.90 | 0.35 | 0.95 |
二级(合格) | 0.05 | 0.80 | 0.50 | 0.80 |
三级(勉强) | 0.10 | 0.70 | 0.65 | 0.70 |
四级(不合格) | 0.20 | 0.60 | 0.80 | 0.60 |
对照模型检验等级参照表,对此模型综合评价
① 平均相对误差 ,精度为一级;
② 关联度 ,关联度为一级;
③ 后验差比值 ,一般要求其最大不超过0.65;小概率误差 ,一般要求不得小于0.7,此两项指标基本合格。
分析指标C和p计算中过程,看出模型预测精度主要受限制于 ,而可以与预测的实际精度无关。例如,可能存在当很大时,意味着预测精度很差,但C和p值达到预测精度“好”的等级,说明这个检验方法无法准确判明预测模型的可信度和预测精度,所以,此检验方法并不可取,舍去指标值C和p。
一般情况下采用相对误差检验指标,此预测模型的相对误差仅,较为理想;同时关联度为0.9999接近与1,说明预测模型曲线与实际行为曲线较为相似,采用这些检验方法,验证了模型的合理性,综合结果表明:此模型可信度和预测精度较高,适合与死亡率预测模型。
用同样的方法对各年人口出生率建立预测模型。
第五步,代入数据计算,利用模型对死亡率和出生率进行预测:
得到出生率与死亡率预测曲线,如图4、图5所示:
图42000-2040年 出生率预测曲线
图4的回归方程为:
图5 2000-2040年 死亡率预测曲线
图5的回归方程:
通过分析以上(3)、(4)式可以得到:出生率的变化率是远大于死亡率的变化率的,人口死亡率的变化非常小,以的数量级变化,表明各年死亡率处于持平的水平,较稳定。由(3)、(4)两个式子相等可以得到出生率与于死亡率相等的年份,这个年份内人口仍然会增长,超过此年份,人口就会下降了。
由以上数据,得到第k年总人口数
(单位:亿人)
用此模型对人口总数的预测得到表3中结果:
表3未来40年(2006——2045)的人口总数
年份 | 总人数(亿) | 年份 | 总人数(亿) | 年份 | 总人数(亿) | 年份 | 总人数 (亿) |
2006 | 12.79 | 2016 | 13.43 | 2026 | 14.11 | 2036 | 14.81 |
2007 | 12.85 | 2017 | 13.50 | 2027 | 14.18 | 2037 | 14.89 |
2008 | 12.92 | 2018 | 13.56 | 2028 | 14.24 | 2038 | 14.96 |
2009 | 12.98 | 2019 | 13.63 | 2029 | 14.31 | 2039 | 15.03 |
2010 | 13.04 | 2020 | 13.70 | 2030 | 14.38 | 2040 | 15.10 |
2011 | 13.11 | 2021 | 13.77 | 2031 | 14.46 | 2041 | 15.18 |
2012 | 13.17 | 2022 | 13.83 | 2032 | 14.53 | 2042 | 15.25 |
2013 | 13.24 | 2023 | 13.90 | 2033 | 14.59 | 2043 | 15.33 |
2014 | 13.30 | 2024 | 13.97 | 2034 | 14.67 | 2044 | 15.40 |
2015 | 13.37 | 2025 | 14.04 | 2035 | 14.74 | 2045 | 15.48 |
模型二:时间推移模型(分年龄段)
1、基于图形的分析
对附件2数据补充分析:将2001年到2005年的市、镇、乡的男女各个年龄的人数比率图画出,如图6、图7:
图6 2001年市、镇、乡的男女各个年龄的人数比率
图7 2004年市、镇、乡的男女各个年龄的人数比率
比较图6,图7发现,其各个年龄的变化趋势是一致的,即抽样反映的总体的基本特征是一致的,因此我们假设此附件2中数据是对相同的城镇进行研究后得到的。
分析相邻各年数据,得到以下结论:各年龄段人所占比率随时间向后等时间间隔推移,各年龄段人口具有时间推移效应。
结合处理后2003数据,并采用时间推移的方法将2004年的数据进行推移得到2005年的人口的一些情况(推移原理后面的论文中有提到见页)上网查资料补充数据,发现,2005年的抽样比为1.325%,所以将其抽样比变为1%后得到图形与我们用2004年的图形进行比较,得到如图8所示:
图8 2005年推移图与原图比较
将两个图通过取平均差的方式进行比较,得到两个图的平均差为0.0062,这说明两个图形的重合效果是比较好的,这也在一定程度上说明了推移模型的合理性。
2、模型的建立与求解
首先,利用模型一求得的出生率和死亡率结果如下:
表4出生率和死亡率
年份 | 2001 | 2002 | 2003 | 2004 | 2005 |
出生率 | 0.01135 | 0.01097 | 0.01068 | 0.01061 | 0.00937 |
死亡率 | 0.01135 | 0.01097 | 0.01068 | 0.01061 | 0.00937 |
由于我们假设的前提是这些数据均是由相同的城、镇、村得到的,不考虑移民的情况下,在这个封闭的系统中,我国的人口变化只与出生率和死亡率有关,由模型一中预测死亡率的数据可以看出,各年人口死亡率大致持平的,所以其对人口增长的影响不大,为了简化问题,不考虑死亡率的影响,利用推移原理由上一年的各个年龄段的人口数得到下一年的各个年龄段的人口数。又因为在稳定的形势下(即不考虑灾难造成的影响),所以采用平均加权的方式求得平均死亡率为0.061,并认为这个平均死亡率是大致稳定的。
推移原理具体如下(以2001年的人口数推年的人口数为例说明):
1)在不考虑各个年龄段死亡率的前提下,2001年妇女的生育率会转化为2002年的0岁的人口数,转化为2003年的1岁的人数,依次类推转化为2040年的39岁的人数,90岁以上的人口有可能成为91岁的,有可能自然死亡。
2)通过上面的类推分析,利用MATLAB软件将附件2中2002年的各个年龄段的原来人口图和类推的图画在一个图形中进行比较,得到如图9所示的结果。
图9推移图与原图比较
仍将两个图通过取平均误差的方式进行比较,得到两个图的平均差为0.0099,说明两个图形相合的很好,我们又用以2002年的各个年龄段的人口数来推2003年的各个年龄段的人口数,也得到比较好的结果,如图10:
图102003年推移图与原图比较
对其它各年的进行类推,也得到了比较好的结果,这里就不一一列出了。这些图像是在没有考虑死亡率的影响的情况下得到的,从这些图像相合的比较好的结论中,也得出了推移模型是比较合理的,而且推移模型可以求出任意一年的任何一个年龄段的人口的大致数目,在一定程度上是比较适用的,推得的结果也是比较准确的。
再利用模型一中灰色系统对出生率进行预测,得到如表5结果:
表5出生率预测结果
年份 | 比率% | 年份 | 比率% | 年份 | 比率% | 年份 | 比率% |
2001 | 1.13 | 2011 | 0.74 | 2021 | 0.47 | 2031 | 0.29 |
2002 | 1.10 | 2012 | 0.70 | 2022 | 0.44 | 2032 | 0.28 |
2003 | 1.07 | 2013 | 0.67 | 2023 | 0.42 | 2033 | 0.27 |
2004 | 1.06 | 2014 | 0.64 | 2024 | 0.41 | 2034 | 0.26 |
2005 | 1.06 | 2015 | 0.61 | 2025 | 0.39 | 2035 | 0.24 |
2006 | 0.94 | 2016 | 0.59 | 2026 | 0.37 | 2036 | 0.23 |
2007 | 0.89 | 2017 | 0.56 | 2027 | 0.35 | 2037 | 0.22 |
2008 | 0.85 | 2018 | 0.53 | 2028 | 0.34 | 2038 | 0.21 |
2009 | 0.81 | 2019 | 0.51 | 2029 | 0.32 | 2039 | 0.20 |
2010 | 0.77 | 2020 | 0.49 | 2030 | 0.31 | 2040 | 0.19 |
利用上述的推移原理,结合上表中的数据利用MATLAB软件求解得到如表6预测结果(此表为预测的总体人数)
表6 预测总人口数
年份 | 总人数(亿) | 年份 | 总人数(亿) | 年份 | 总人数(亿) | 年份 | 总人数 (亿) |
2001 | 12.21 | 2011 | 13.42 | 2021 | 14.25 | 2031 | 14.81 |
2002 | 12.34 | 2012 | 13.52 | 2022 | 14.32 | 2032 | 14.85 |
2003 | 12.48 | 2013 | 13.61 | 2023 | 14.38 | 2033 | 14.89 |
2004 | 12.61 | 2014 | 13.71 | 2024 | 14.45 | 2034 | 14.93 |
2005 | 12.74 | 2015 | 13.79 | 2025 | 14.50 | 2035 | 14.97 |
2006 | 12.87 | 2016 | 13.88 | 2026 | 14.56 | 2036 | 15.01 |
2007 | 12.99 | 2017 | 13.96 | 2027 | 14.61 | 2037 | 15.04 |
2008 | 13.10 | 2018 | 14.04 | 2028 | 14.67 | 2038 | 15.08 |
2009 | 13.21 | 2019 | 14.11 | 2029 | 14.71 | 2039 | 15.11 |
2010 | 13.32 | 2020 | 14.18 | 2030 | 14.76 | 2040 | 15.14 |
得到如图11所示的人口增长趋势,这个图形基本上符合现阶段我国的实际情况。
图11 人口增长趋势图
3、结果的分析
此结果与附件一中的预测总人口将于2010年、2020年分别达到13.6亿人和14.5亿人,2033年前后达到峰值15亿人左右是相符的,也满足我们国家的战略目标到2010年人口总量控制在13.6亿人,到2020年人口总量控制在14.5亿人,到本世纪中叶人口峰值控制在15亿人左右人口总量。
五、对人口增长分析的数学模型的建立
(一)对中国人口增长问题的分析:
研究现阶段中国人口的实际情况,近年来主要由以下特点:
a.乡村人口城镇化;
b.出生人口性别比持续升高;
c.老龄化进程加速。
对上述特点,采用上述两预测模型分别予以分析讨论:
1、乡村人口城镇化趋势分析
将城市与镇人口归为一类,乡村人口为一类,对于封闭的系统,乡村迁出的人口数即为城镇迁入的人口数,而
迁入(迁出)率=
所以只需计算从乡村迁出人口即可。
对于确定的第k年,统计出2001——2005各年乡村人口总数,作为人口原始时间序列,运用GM(1,1)模型得到预测的乡村人口总数。
利用模型二,预测出乡村人口死亡率和出生率,代入乡村总人口公式得到第k年递推的乡村实际人口总数。
则 与 之间的差值即为乡村第k年迁出人口数绘制迁入人口数预测图,如图12:
图12第k年迁出人口数图
图12中的是2004年、2008年、2015年、2030年的乡村第k年迁出人口数,从此图中可以观测乡村迁出人口的变化。
2、男女人口比例趋势分析
我们引用了网上的数据分别预测出各年男女人数,然后分别对男人口数和女人口数进行线性回归分析,得到(5)式
由(5)式中的男女直线斜率,得到男性比女性人口增长的要快,图13所示
说明:图形的纵坐标为人口数(单位:百万)。
图13 男女比例图
3、老龄化进程变化趋势
将人口数按以下的划分方式分为14类,分类原则:65岁以下的,每五岁化为一类,65岁及以上的化为一类。在分类的基础上仍然采用上述模型二中的推移原理,得到了每个小类具体的人口预测结果,由于数据较多,这里不予介绍,考虑到实际情况,我们将所划分的14类总和为三类(0—14、15—64、65及以上),并画出以下图形进行说明:
在上述模型中我们进行了一些改进:推移模型时在忽略了虑死亡率的情况下,这与实际情况不太相符,而且老年人死亡率是比较大的,在这种情况下,在分析老年化问题的时候就应该将死亡率考虑进去,具体做法如下:
1、将2001年到2005年各年的老年人的死亡率按取平均的方式,得出各年老年人的平均死亡率。
2、用2001年到2005年各年的老年人的比重减去上述平均死亡率,即得到2001年到2005年老年人的净比重。
3、用GM(1,1)模型将以后各年的净比重预测出。
4、再利用上述的推移模型得到其变化趋势(如图14)。
图14幼年、青年、老年变化趋势
由图形可以看出65岁以上的人口是逐渐增多的,这说明我国人的年龄趋向老年化,0—14岁的人是逐渐减少的,这说明我国近年来计划生育政策得到
推广,并取得较好的成效。15—64岁的人口也是呈上升趋势的,且上升的速度比较快,这就说明我国人的抚养能力是增加的,也为老年化趋势做铺垫。
此模型对预测人口总数、任意一年的任何一个年龄段的人口的大致数目和分段预测老年化趋势均有较好的结果,但是由于此模型是建立在封闭系统中的,对我国出生人口性别比持续升高,以及乡村人口城镇化这两个人口特点不好说明,因此我们引进GM(1,1)模型我国的人口特点作进一步的说明。
(二)时间时序滑动样本均方差模型的建立
总体来说,我国人口与自然资源、环境的矛盾将长期存在,这要求我们必须在一个相当长的时间段内控制人口总数,所以在近50年的时间段内的人口总数必然要争取保持下降。但在同时,人口总数的大起大落也很有害。
人口总数及老龄化问题的波动的预测!尽量是稳中有降,避免大的波动。(此可以作为一个亮点)利用“时序滑动样本均方差”作为量化分析指标,其定义如下:设总人数序列为, ,…, ,...,其“时序滑动样本均方差”为(以样本容量5为例):第1至第5的共5个数的样本均方差、第2至第6的共5个数的样本均方差、…、第 至第的共5个数的样本均方差、…。
其中,样本均方差的定义为: 。
结果如表7:
单位(亿):表7 时序滑动人口总数样本均方差表
年份区间 | 均值 | 均方差 | 年份区间 | 均值 | 均方差 |
2001-2005 | 12.4778 | 0.21358 | 2019-2023 | 14.251 | 0.1072 |
2002-2006 | 12.6099 | 0.20732 | 2020-2024 | 14.3175 | 0.10288 |
2003-2007 | 12.7381 | 0.20005 | 2021-2025 | 14.3812 | 0.09872 |
2004-2008 | 12.8622 | 0.19194 | 2022-2026 | 14.4424 | 0.0947 |
2005-2009 | 12.9818 | 0.18388 | 2023-2027 | 14.5011 | 0.09083 |
2006-2010 | 13.096 | 0.17851 | 2024-2028 | 14.5574 | 0.0871 |
2007-2011 | 13.2069 | 0.17198 | 2025-2029 | 14.6113 | 0.08351 |
2008-2012 | 13.3137 | 0.16563 | 2026-2030 | 14.6631 | 0.08006 |
2009-2013 | 13.4165 | 0.15945 | 2027-2031 | 14.7127 | 0.07673 |
2010-2014 | 13.5154 | 0.15345 | 2028-2032 | 14.7602 | 0.07353 |
2011-2015 | 13.6107 | 0.14763 | 2029-2033 | 14.8058 | 0.07046 |
2012-2016 | 13.7023 | 0.14198 | 2030-2034 | 14.8494 | 0.0675 |
2013-2017 | 13.7904 | 0.13651 | 2031-2035 | 14.8912 | 0.06466 |
2014-2018 | 13.875 | 0.13121 | 2032-2036 | 14.9312 | 0.06193 |
2015-2019 | 13.9564 | 0.12607 | 2033-2037 | 14.9696 | 0.05931 |
2016-2020 | 14.0346 | 0.12111 | 2034-2038 | 15.0063 | 0.05679 |
2017-2021 | 14.1097 | 0.11631 | 2035-2039 | 15.0415 | 0.05437 |
2018-2022 | 14.1818 | 0.11168 | 2036-2040 | 15.0751 | 0.05205 |
表7中的均方差都是比较小的,说明人口稳中有降,波动比较小,符合我国的实际情况,符合当前的经济发展。
老龄化指数序列为 , ,……, ,……,(这里的表示第K年老年人占总人数的比率)其中“时序滑动样本均方差”与总人数序列的定义相同。这里我们计算了2001到2040年(以样本容量5为例),因此有36个数据。
得到的结果如表8:
表8老龄化指数序列均方差表
年份区间 | 均值 | 均方差 | 年份区间 | 均值 | 均方差 |
2001-2005 | 0.0787 | 0.005772 | 2019-2023 | 0.1817 | 0.013241 |
2002-2006 | 0.0824 | 0.006115 | 2020-2024 | 0.1902 | 0.013856 |
2003-2007 | 0.0864 | 0.006463 | 2021-2025 | 0.1992 | 0.014499 |
2004-2008 | 0.0905 | 0.00681 | 2022-2026 | 0.2086 | 0.015172 |
2005-2009 | 0.0949 | 0.006904 | 2023-2027 | 0.2184 | 0.015876 |
2006-2010 | 0.0994 | 0.007335 | 2024-2028 | 0.2287 | 0.016613 |
2007-2011 | 0.1042 | 0.007676 | 2025-2029 | 0.2394 | 0.017384 |
2008-2012 | 0.1091 | 0.008034 | 2026-2030 | 0.2507 | 0.018191 |
2009-2013 | 0.1143 | 0.008407 | 2027-2031 | 0.2625 | 0.019035 |
2010-2014 | 0.1198 | 0.008798 | 2028-2032 | 0.2748 | 0.019918 |
2011-2015 | 0.1255 | 0.009207 | 2029-2033 | 0.2877 | 0.020841 |
2012-2016 | 0.1314 | 0.009635 | 2030-2034 | 0.3012 | 0.021808 |
2013-2017 | 0.1377 | 0.010083 | 2031-2035 | 0.3153 | 0.022819 |
2014-2018 | 0.1442 | 0.010552 | 2032-2036 | 0.3301 | 0.023877 |
2015-2019 | 0.151 | 0.011042 | 2033-2037 | 0.3455 | 0.024984 |
2016-2020 | 0.1582 | 0.011555 | 2034-2038 | 0.3617 | 0.026143 |
2017-2021 | 0.1656 | 0.012092 | 2035-2039 | 0.3786 | 0.027354 |
2018-2022 | 0.1735 | 0.012654 | 2036-2040 | 0.3963 | 0.028622 |
表8中的均方差都是比较小的,说明人口老龄化趋势稳中有降,波动也比较小,有利于国家对老龄化进程的控制。
(三)人口问题控制模型的建立
基于论文中模型得出的结论,联系中国的实际情况,既要解决我国总人口的不断增长问题,又要解决人口老龄化进程加速问题。因为人口的增长与出生率和死亡率有关,在死亡率相对稳定的今天,我国大力推行的“晚、稀、少”的生育政策,使现在的总和生育率稳定在了1.8,并且还有减小的趋势,这样做是可以在一定程度上降低我国的人口数,但由于总人口数下降,而老年人的人数没有下降,这样老龄化比重就会升高,出生率越低,老龄化趋势相对会越来越严重,这样就必须考虑让老龄化的增长趋势保持在一定的范围内,尽量使我国的人口总数下降。
另一方面,出生率的下降,我们也付出了沉重的代价,例如出生婴儿性别比的升高、偏高问题,家庭养老功能的弱化问题,独生子女素质发展的失衡问题,统计数据的失真问题,干群关系的紧张问题,如此等等。又由于我国人口城镇化的问题越来越严重,在另一层面上也使我国的老龄化趋势越来越严重。
对于我国人口的这些特点,在此我们主要从人口总数和老龄化进程这两个方面来考虑,根据附件1中的我国人口的战略目标是在2050年达到15亿左右的峰值,并保持此稳定发展下去,对此我们主要从下面两个方向去考虑:
1、老龄化进程的调整方案
由附件1,得到:如果总人口中65岁及以上的老年人比重超过7%,或者60岁及以上的老年人口比重超过10%,那么人口就属于老年型,我们以65岁为例进行分析,首先我们引进控制函数:
得到以下表达式:
符号说明:
表示政府对老龄化趋势的控制力度系数, 表示政府何时应采取控制,
表示原来的老年人口的比重, 表示政府调整后的老年人口的比重
公式说明:
对于老年人口比重不超过7%的,政府不予进行控制;对于老年人口的比重大于7%的,通过控制力度系数 进行调整,根据的不同,会得到不同的结果。下图是我们将政府的控制力度系数 =0.5时的老龄化曲线的变化图15:
图15 老年化曲线的调整图
2、总人口增长的调整方案
考虑到上述两模型是在自然状态下,仅考虑即出生率和死亡率进行预测,所以所得人口总数曲线为一条持续增长曲线,由于实际社会因素对人口增长的影响也占有一定比重,尤其时国家采取措施治理人口问题的力度,例如:提倡晚婚晚育措施控制出生人口,控制流动迁移人口,统筹区域协调发展等。
为了使人口模型按我们所预期的期望增长趋势逐年减小,并将现实中国为解决这些问题采取的各项措施体现出来,引入“有效控制函数”。使得原本按照自然规律变化增长下的人口增长在“有效控制函数”的影响下按照我们所预期的期望逐渐变化。即:控制函数的起点则代表了政府采取有力措施的起始时间,并将现实中的各种措施用映射的观点,将其转化为控制函数中的某些参量,即:国家对人口问题控制作用的影响完全由控制函数体现。有效控制函数C的引入:
函数公式解释说明:
:为期望人口调节系数,为得到期望人口数而设;
的意义:构造的一个下降趋势的函数.它是以国家开始采取措施的控制时间 作为起始时刻的。
γ:代表了国家政府等采取措施的力度。
将此函数加入人口预测模型的函数式中,对其调整,则调整后第k年总人口数
公式的说明:
将非老年人与老年人比重分开讨论,并且采用了政府调整后的老年人口的比重,目的在于保证老年人口比重的情况下对我国人口总数进行调整,也考虑到青年人对幼年和老年人有抚养义务,所以可以通过不断的改变控制力度系数,达到最优的效果。
由于此模型中的 等系数不好得出,采用局部搜索法,在一定范围内对 、γ均以0.1为步长进行搜索,图16是取=1,γ=2.5时得到的,图中下面的线是实施控制后的变化曲线,它的变化趋势比较缓慢,且趋于平行,说明到本世纪中叶,我国如果采取这样的控制力度,可以将我国人口稳定在15亿左右。
图16人口增长趋势调整图
说明:图15中下面的曲线为调整后的人口增长趋势曲线。
六、模型的优缺点评价
优点:
1、我们的结论建立在对数据科学分析的基础上,反映了客观实际,增强了说服力,例如我们在建模前对数据预处理阶段,通过参数假设检验说明初生人口性别比的结论;
2、模型一中,在运用死亡率预测模型进行预测前,首先采用多种检验方法对此GM(1,1)模型的合理性进行检验,量化出相对误差,关联度等多项检验指标,并对模型综合评价,确保了此模型在应用时的有效性和可信性;
3、在对人口增长趋势进行预测后,为了对总人口数进行控制,我们引入政府控制力度,并将其作为参数体现在有效控制函数中,来反映政府采取的措施对人口增长的影响,表现了政府采取的措施对人口增长的控制作用。
缺点:
1、在对人口增长趋势进行预测时未考虑人口素质的影响,例如可以通过提高人口素质改变人们的生育观念(特别时提高乡村人口素质,改变他们的生育观念,如:“生儿防老”等传统观念)进而降低生育率水平就值得探讨。
2、辅助数据的数量与广度也有待扩大,样本的局限不能使所用方法与所建模型增色,例如若能多援引些网上所查数据对样本进行补充,模型的精度和可信度都会有相应的提高;
3、我们虽然采用有效的控制函数来反映政府的控制作用对人口增长的影响,但其参数政府控制力度难以准确定量。
七、辅助数据与参考文献
1、辅助数据:
2、参考文献:
【1】 郭齐胜 杨秀月 王杏林等,《系统建模》,北京:国防工业出版社,2006年。
【2】 赵静 但琦,《数学建模与数学实验》,北京:高等教育出版社,2006年。
【3】 彭勇行,《管理决策分析》,北京:科学出版社,2005年。
【4】 王沫然,《MATLAB与科学计算》,北京:电子工业出版社,2006年。