python双重差分_双重差分法(DID)介绍

python双重差分_双重差分法(DID)介绍
双重差分法,英⽂名Differences-in-Differences,别名“倍差法”,⼩名“差中差”。作为政策效应评估⽅法中的⼀⼤利器,双重差分法受到越来越多⼈的青睐,概括起来有如下⼏个⽅⾯的原因:(1)可以很⼤程度上避免内⽣性问题的困扰:政策相对于微观经济主体⽽⾔⼀般是外⽣的,因⽽不存在逆向因果问题。此外,使⽤固定效应估计⼀定程度上也缓解了遗漏变量偏误问题。(2)传统⽅法下评估政策效应,主要是通过设置⼀个政策发⽣与否的虚拟变量然后进⾏回归,相较⽽⾔,双重差分法的模型设置更加科学,能更加准确地估计出政策效应。(3)双重差分法的原理和模型设置很简单,容易理解和运⽤,并不像空间计量等⽅法⼀样让⼈望⽽⽣畏。(4)尽管双重差分法估计的本质就是⾯板数据固定效应估计,但是DID听上去或多或少也要⽐OLS、FE之流更加“时尚⾼端”,因⽽DID的使⽤⼀定程度上可以满⾜“虚荣⼼”。
在细致介绍DID之前⾸先强调⼀点,⼀般⽽⾔,DID仅适⽤于⾯板数据,因此在只有截⾯数据时,还是不要浪费⼼思在DID上了。不过,事⽆绝对,在某些特殊的情景下,截⾯数据通过巧妙的构造也是可以运⽤DID的,⼤神Duflo曾经就使⽤截⾯数据和DID研究了南⾮的养⽼⾦计划项⽬对学前⼉童健康的影响,感兴趣的可以去搜搜⼤神的⽂章。dnv
具体来说,基准的DID模型设置如下:
其中,du为分组虚拟变量,若个体i受政策实施的影响,则个体i属于处理组,对应的du取值为1,若个体i
决战朝鲜攻略不受政策实施的影响,则个体i属于对照组,对应的du取值为0。dt为政策实施虚拟变量,政策实施之前dt取值为0,政策实施之后dt取值为1。du·dt为分组虚拟变量与政策
实施虚拟变量的交互项,其系数
就反映了政策实施的净效应。
从DID的模型设置来看,要想使⽤DID必须满⾜以下两个关键条件:⼀是必须存在⼀个具有试点性质的政策冲击,这样才能到处理组和对照组,那种⼀次性全铺开的政策并不适⽤于DID分析;⼆是必须具有⼀个相应的⾄少两年(政策实施前后各⼀年)的⾯板数据集。
为什么交互项du·dt的系数
就能够体现出政策的净效应呢?这⼀点可以通过下表来体现(下表也反映了双重差分法五个字的真正含义):
双重差分法的基本思想就是通过对政策实施前后对照组和处理组之间差异的⽐较构造出反映政策效果的双重差分统计量,将该思想与上表的内容转化为简单的模型(1),这个时候只需要关注模型(1)中交互项的系数,就得到了想要的DID下的政策净效应。
行政职务婴儿死亡更进⼀步地,DID的思想与上表的内容可以通过下图来体现:
图中红⾊虚线表⽰的是假设政策并未实施时处理组的发展趋势。事实上,该图也反映出了DID最为重要和关键的前提条件:共同趋势(Common Trends),也就是说,处理组和对照组在政策实施之前必须具有相同的发展趋势。DID的使⽤不需要什么政策随机以及分组随机,只要求CT假设,因此⽤DID做论⽂时必须对该假设进⾏验证,⾄于具体怎么验证,后⾯再说。
很多时候,⼤家在看使⽤DID的⽂献时,会发现别⼈的基准模型和模型(1)并不完全⼀致,别⼈的模型如下:自由交易
别⼈的模型⾥只有交互项du·dt,⽽缺失了du和dt,是哪⾥出问题了么?并没有,模型(1)和(2)本质还是⼀样的,且模型(2)在多年⾯板数
据集⾥更为常见。模型(2)中,
为个体固定效应,更为精确地反映了个体特征,替代了原来粗糙的分组变量du;
为时间固定效应,更为精确地反映了时间特征,替代了原来粗糙的政策实施变量dt。因⽽,du和dt并未真正从模型中消失,只是换了个马甲。模型(2)事实上就是⼀个双向固定效应模型,这也是为什么DID⽅法⼀定程度上可以减轻遗漏变量偏误的原因(主要是消除那些不可观测的⾮时变因素,为了使估计结果尽可能准确,模型中还是要加⼊控制变量)。
在介绍完DID的基本思想和模型设定后,现在要开始强调同等重要的内容,那就是稳健性检验——必须证实所有效应确实是由政策实施所导致的。很多⼈对这⼀点并不重视,认为DID很简单,随便跑⼏个回归就可以写出⼀篇⼤作了。关于DID的稳健性检验,主要表现在两个⽅⾯:
(1)共同趋势的检验。这个假设是⽐较难验证的,看⽂献时会发现别⼈经常没有做该检验,⽐如,很多⼈做DID时只有政策实施前后各⼀年的数据,这样的的话根本⽆法验证政策实施前的趋势问题。不过,如果是多年的⾯板数据,可以通过画图来检验CT假设,之前推荐的那篇AER⽂章就画了⼤量的图形对此进⾏了说明。
(2)即便处理组和对照组在政策实施之前的趋势相同,仍要担⼼是否同时发⽣了其他可能影响趋势变化的政策,也就是说,政策⼲预时点之后处理组和对照组趋势的变化,可能并不真正是由该政策导致的,⽽是同时期其他的政策导致的。这⼀问题可以概括为处理变量对产出变量作⽤机制的排他性,对此,可以进⾏如下的检验:
A. 安慰剂检验,即通过虚构处理组进⾏回归,具体可以:a)选取政策实施之前的年份进⾏处理,⽐如原来的政策发⽣在2008年,研究区间为2007-2009年,这时可以将研究区间前移⾄2005-2007年,并假定政策实施年份为2006年,然后进⾏回归;b)选取已知的并不受政策实施影响的组作为处理组进⾏回归。如果不同虚构⽅式下的DID估计量的回归结果依然显著,说明原来的估计结果很有可能出现了偏误。
最爱视听
B. 可以利⽤不同的对照组进⾏回归,看研究结论是否依然⼀致。
C. 可以选取⼀个完全不受政策⼲预影响的因素作为被解释变量进⾏回归,如果DID估计量的回归结果依然显著,说明原来的估计结果很有可能出现了偏误。等等。
尽管DID的基本原理很简单,但其实际运⽤⼗分灵活,并不是上⾯⼀点内容可以介绍完的,⼤家应当多去看相关的⽂献,然后多做总结。关于DID的⼀些扩展内容,⽐如DDD、PSM-DID等,以后再跟⼤家细说。

本文发布于:2024-09-21 12:39:07,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/358758.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:政策   实施   变量   模型   双重   处理   差分法   回归
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议