中国人口平均预期寿命预测及其面临的问题研究

2021年第6期(总第249期)人口与经济POPULATION &ECONOMICS No.6,2021
(Tot.No.249)中国人口平均预期寿命预测及其
面临的问题研究
王广州
(中国社会科学院人口与劳动经济研究所,北京100010)
摘㊀要:以经典的Lee-Carter 死亡率模型为工具,采用中国1994 2019年死亡数
通路精耕据,构建Lee-Carter 死亡率模型,研究中国人口平均预期寿命预测问题㊂研究表
椎名朔哉
明:虽然中国死亡数据资源越来越丰富,但不同来源数据质量差距和冲突依然比较
明显㊂随着死亡水平的下降,1994年以来1ɢ人口变动抽样调查死亡数据面临的质
量问题比较突出㊂从Lee-Carter 死亡率模型拟合效果来看,模型拟合年龄别死亡率
平均相对误差较小的年龄组为40 84岁,0岁组拟合效果较差,而0岁人口死亡
率的数据质量在模型拟合㊁平均预期寿命推算和预测过程中非常重要㊂由于年龄别
死亡率数据误差相抵的原因,对出生人口平均预期寿命的推算误差明显下降㊂在平
均预期寿命研究结果的应用过程中,对不同年龄人口平均预期寿命的相对误差和绝
对误差需要区别对待㊂考虑到中国历史数据的质量问题,在建模过程中需要防止模
型对基础数据的过度拟合问题㊂由于死亡人口重报,特别是多报的可能性很小,现
有数据和模型对人口平均预期寿命的估计或预测肯定是一个高估㊂
关键词:Lee-Carter 模型;平均预期寿命;死亡率;数据质量
中图分类号:C921㊀文献标识码:A ㊀文章编号:1000-4149(2021)06-0022-18
DOI :10.3969/j.issn.1000-4149.2021.00.046
收稿日期:2021-06-24;修订日期:2021-09-09
基金项目:国家社会科学基金重大项目 人口统计调查的国际前沿理论及其在中国的应用 (16ZDA090)㊂
作者简介:王广州,人口学博士,中国社会科学院人口与劳动经济研究所研究员㊂
Research on the Prediction and Its Problems of Life Expectancy of Chinese Population
WANG Guangzhou
(Institute of Population and Labor Economics,Chinese Academy of Social Sciences,㊃
22㊃
王广州:中国人口平均预期寿命预测及其面临的问题研究
Beijing100010,China)
Abstract:By means of the classical Lee-Carter mortality model and Chinese mortality data from1994to2019,this paper constructs the Lee-Carter mortality model to study the prediction of Chinese life expectancy at birth.The research shows that although Chinese mortality data sources are get rich step by step,the gap and conflict of data quality from different sources are still obvious.With the decline of mortality level,the quality problem of mortality data in1ɢpopulation change sampling survey since1994is more prominent. From the fitting effect of Lee-Carter mortality
model,the age group with small average relative error in fitting age-specific mortality is40-84years old,and the fitting effect of 0-year-old group is poor.The data quality of0-year-old population mortality is very important in the process of model fitting,calculation and prediction of life expectancy at birth.Due to the error offset of age-specific mortality data,the estimation error of life expectancy at birth decreased significantly.In the application of the research results of life expectancy at birth,the relative error and absolute error of life expectancy at birth of population for different ages need to be treated differently.Considering the quality of Chinese historical data,it is necessary to prevent the model from over fitting in the modeling process.Since there is little possibility of re-reporting,especially over reporting, the existing data and models must overestimate or over prediction the life expectancy at birth.
Keywords:Lee-Carter model;life expectancy;mortality;data quality
一、研究背景
平均预期寿命不仅是人口科学研究的重要指标,同时也是很多相关科学研究关注的重要内容㊂平均预期寿命之所以重要,是因为一方面平均预期寿命是健康水平的重要测量指标,另一方面平均预期寿命也是社会发展和科技进步的标志㊂在人类社会进步的历史长河中,对寿命的关注远远超出许多其他事
物㊂1662年从格兰特(Graunt)提出生命表开始[1],平均预期寿命的基本概念和测量体系逐步成为人口科学㊁社会保障㊁卫生健康等许多基础研究的重要分析工具㊂长期以来,平均预期寿命不仅是联合国开发计划署人类发展指数(HDI)构建的三大重要基础变量之一,同时也是中国国民经济和社会发展规划的重要指标㊂2016年10月,中共中央㊁国务院印发了‘ 健康中国2030 规划纲要“㊂2017年10月,十九大报告中指出实施健康中国战略㊂2019年11月,中共中央㊁国务院印发了‘国家积极应对人口老龄化中长期规划“,2020年10月,‘中国共产党第十九届中央委员会第五次全体会议公报“提出实施积极应对人口老龄化国家战略㊂无论是健康中国战略还是积极应对人口老龄化国家战略都离不开对未来健康水平的监测评估,而平均预期寿命正是连接和判断两大国家战略进展情况的重要统计指标和分析工具㊂
除了国家重大发展战略外,随着社会经济的发展和数据采集能力的提高,国民经济和社
㊃32㊃
㊀‘人口与经济“2021年第6期
会发展规划对平均预期寿命予以高度重视㊂早在 十二五 规划中,人均预期寿命①就被列为重要的规划目标㊂ 十二五 期间人均预期寿命规划目标是到2015年人均预期寿命达到74.5岁,但2015年实际人均预期寿命为76.34岁②,远远超过规划目标的要求㊂ 十三五 规划人均预期寿命则列为预期性指标,并没有明确提出预期目标的具体大小③㊂ 十四五 规划中人均预期寿命也被列为预期性指标,对2025
年的目标没有提出具体的规划要求㊂虽然对平均预期寿命不断增长的目标和方向不变,但具体到未来社会经济发展能够使得平均预期寿命有多大的变化,却是一个非常困难的研究问题,特别是不同区域或省际之间如何设定规划目标困难重重:目标太低,很快实现了,目标太高,又无法判断是否确实难以达到,很难确认是预测出现很大偏差还是基础数据问题引起的误判㊂平均预期寿命规划目标难以确定一方面是对平均预期寿命的状况水平测量结果有很大争议,婴儿死亡率数据质量问题突出[2-3],特别是在人口规模较少或调查样本较小的情况下,死亡数据可能偏差很大;另一方面是对平均预期寿命预测结果的可靠性存在疑问,直接通过时间序列数据对平均预期寿命进行模型外推,还是通过预测年龄别死亡率结果再推算平均预期寿命[4-5]因此,科学测量和准确预测平均预期寿命的基本状况和变化趋势,不仅具有重要的科学研究价值,同时也具有非常重要的现实意义㊂
二、文献综述
平均预期寿命是人口分析的关键指标之一,是人口预测模型的基础㊂对平均预期寿命的预测关系到人口预测模型的质量㊂平均预期寿命参数估计方法与普通预测既有相同的一面,又有不同的一面㊂相同之处在于可以采用历史数据建立回归模型,然后进行趋势外推㊂不同之处在于不同人口所处的发展阶段不同,可以通过已有其他人口作为重要的基础数据,进行回归建模,然后进行参数预测,比如模型生命表方法就属于这类应用,这个做法通常是解决现有人口基础数据质量不高或时间序列数据相对较少的问题㊂
平均预期寿命预测包括两部分研究工作,第一部分是对年龄别死亡率的预测,第二部分是根据预测的年龄别死亡率建立相应的生命表,从而得到平均预期寿命的预测结果㊂平均预期寿命的预测首先需要解决年龄别死亡率的预测问题㊂对年龄别死亡率的预测通常采用Lee-Carter 模型[6]㊂Lee-Carter 模型是该领域研究最典型的方法,对死亡率随机预测研究影响巨大,世界各国的相关应用和方法改进文献不计其数[7-11]㊂回顾中国预期寿命研究的历史,基础数据收集主要是人口普查㊁1%人口抽样调查和年度1ɢ人口变动抽样调查,基础数据质量和数量都受到很大限制,因此多数应用是根据模型生命表进行经验估计㊂2000年以来,特别是2010年以来,对年龄别死亡率的预测研究随着基础数据的不断丰富而开始有很多文献[12]㊂然而,对于平均预期寿命的预测主要是采用Lee-Cater 模型,多数研究也仅限于对中国年龄别死亡率预测方法方面的基础应用研究㊂有㊃
42㊃①②③出生人口平均预期寿命或平均预期寿命在各项规划中均简化为人均预期寿命㊂数据来源:‘中华人民共和国国民经济和社会发展第十三个五年规划纲要“,简称 十三五 规划纲要㊂数据来源:‘中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要“,简称 十四五 规划纲要㊂纲要显示,2019年数据实际情况为77.3岁㊂
王广州:中国人口平均预期寿命预测及其面临的问题研究
学者研究认为,在我国死亡率数据较少的背景下,以Lee-Cater模型为框架的随机死亡率预测模型效果
欠佳[13],但对预测效果欠佳的具体情况和面临的问题并没有非常详尽的文献描述㊂与此同时,有些研究也是采用了Lee-Cater模型为框架的随机死亡率预测模型,而且采用的数据也很少,仅仅是1992 2002年(不含1995年),研究认为Lee-Cater模型对中国死亡率数据具有很好的拟合效果[14],两类研究之间的矛盾确实令人匪夷所思㊂此外,还有一些研究提出有限数据死亡率的建模方法和中国的具体应用[15-16]㊂随着死亡率数据的增加,预测模型效果是否有所改善,效果如何,都需要认真研究和深入探讨㊂此外,Lee-Cater模型在中国具体应用过程中,很少涉及对不同年龄预期寿命预测结果的进一步讨论或预测结果的实证检验㊂
有研究认为,利用人口统计数据建立Lee-Cater死亡率模型对于预测误差的控制通常采用简单外推方法,存在系统的低估偏差[17]㊂即使是对死亡率随时间变化的速度(k t)分布进行区间估计的方法,由于基础模型在很大程度上决定了模型误差的大小,因此,需要进一步改进模型㊂特别是在应用过程中,反而忽略了基础数据本身对预测偏差的影响㊂2019年有学者提出通过对基础数据进行平滑的方法来控制数据的偏差[18]㊂总之,提升预测结果的科学性㊁可靠性的主要方法无非是改善输入数据的质量和改进预测方法,解决问题的途径通常是从理论和实践两个方面进行努力㊂
三、Lee-Carter模型与简略生命表算法
虽然目前国内有很多学者采用中国或国外数据对Lee-Carter模型进行了一些相关应用研究,但绝大多
数研究采用国外学者编制的R语言程序,并没有对算法的实际计算过程和所有细节进行重复演算或验证,包括对Lee-Carter模型1992年出现的经典文献[6]也没有进行仔细的重复检验,同时,在研究过程中,还存在为了模型拟合 效果 舍弃重要可获得数据的现象㊂
本文采用Python语言对相关研究进行重复检验,并对计算过程的细节进行尽可能完整的描述,目的是在检验Lee-Carter模型的同时,补充一些文献对关键算法语焉不详或订正相关研究可能存在的缺陷或错误,也有利于研究者对本研究进行重复检验㊂
1.Lee-Carter模型算法
Lee-Carter模型参数估计主要是采用经典的SVD分解方法㊁加权最小二乘方法和极大似然估计方法㊂在只有年龄别死亡率时间序列数据的情况下,也可以使用最小二乘方法进行参数估计㊂
(1)经典Lee-Carter模型算法㊂有公式如下:tcg
ln(m x,t)=αx+βx k t+εx,t(1)㊀㊀其中,m x,t为t年的年龄别死亡率,αx为年龄x死亡率的对数平均水平,k t为人口死亡率随时间变化的速度,βx为年龄因子对k t的敏感度,εx,t为随机误差项㊂
具体算法如下㊂
㊃52㊃
㊀‘人口与经济“2021年第6期
白洋淀死鱼第一步,计算α^x ,其中α^x =1T神经网络控制
ðT t ln(m x ,t )㊂第二步,令Z (x ,t )=ln(m x ,t )-α
^x ,对矩阵Z (x ,t )=Z 0,1 Z 0,T ︙ ︙Z A ,1 Z A ,T ()进行SVD 分解,
Z (x ,t )=VLUᶄ;V 的第一列用于估计βx ㊂
中国在疫情防控国际合作上采取了哪些行动第三步,令βx =[β0,β1, ,βA ]ᶄ=V 1ðA j =0V 1,j ;K t =[k 1,k 2, ,k T ]ᶄ=λ1(ðA
j =0V 1,j )U 1;其中U 1=[U 1,1,U 1,2, ,U 1,T ]ᶄ,即Uᶄ的第一列,V 1=[V 1,0,V 1,1, ,V 1,A ]ᶄ,即V 的第一行,λ1为L 的第一个奇异值,也是最大的奇异值㊂
第四步,令f (k t )=ðx P x ,t e a ^x +β^x k ^t -ðx
d x ,t ,为了满足在特定的参数αx 和βx 条件下特定年龄别人口的死亡人数,对k t 进一步调整估计㊂在给定精度条件下采用牛顿下山法(New-ton-Raphson)进行迭代㊂即:
K (n +1)t =k (n )t -f (k (n )t )/f ᶄ(k (n )t )k ^(n +1)t =k ^(n )t -[ðx P x ,t e a ^x +β^x k ^(n )t -ðx d x ,t ][ðx
β^x P x ,t e a ^x +β^x k ^(n )t ](2)(2)加权最小二乘法㊂使用最小二乘法估计经典Lee-Carter 模型参数时,需要对如下公式进行最小化:min ðx ,t d x ,t [ln(m x ,t )-αx -βx k t ]2,满足条件ðx βx =1,
ðT t k t =0;d x ,t 为
死亡人口数㊂通过对表达式min ðx ,t d x ,t [ln(m x ,t )-αx -βx k t ]2分别求关于αx ㊁βx 和k t 的一阶导数,并令他们等于0,可以得到求解参数αx ㊁βx 和k t 估计值的计算公式:
α^x =ðT
t =1d x ,t [ln(m x ,t )-β^x k ^t ]ðt d x ,t (3)β^x =ðT t =1d x ,t k ^t ln(m x ,t )-α
^x []ðT
t =1d x ,t k ^2t (4)k ^t =ðT t =1d x ,t β^x ln(m x ,t )-α^x []ðT
t =1d x ,t β^2x
(5)㊀㊀通过迭代方法可以求出αx ㊁βx 和k t 的估计值㊂具体迭代的方法是:首先选取αx ㊁βx 和k t 的初值;把初值依次带入上述三个公式的右
边,得到αx ㊁βx 和k t 的新估计值,再用新的估计值重复上述计算,直到新的估计值与前一个估计值的偏差足够小[19]㊂
对于初值的直接求解方法如下:㊃62㊃

本文发布于:2024-09-21 14:40:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/295671.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预期   寿命   预测   数据   人口   模型   死亡率
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议