did双重差分法_二重差分法分析（DID）

did双重差分法_⼆重差分法分析（DID）

双重差分模型(difference-in-differences)主要被⽤于社会学中的政策效果评估。其原理是基于⼀个反事实的框架来评估政策发⽣和不发⽣这两种情况下被观测因素y的变化。如果⼀个外⽣的政策冲击将样本分为两组—受政策⼲预的Treat组和未受政策⼲预的Control组，且在政策冲击前，Treat组和Control组的y没有显著差异，那么我们就可以将Control组在政策发⽣前后y的变化看作Treat组未受政策冲击时的状况(反事实的结果)。通过⽐较Treat组y的变化(D1)以及Control组y的变化(D2)，我们就可以得到政策冲击的实际效果(DD=D1-D2)。

双重差分法，英⽂名Differences-in-Differences，别名“倍差法”，⼩名“差中差”。作为政策效应评估⽅法中的⼀⼤利器，双重差分法受到越来越多⼈的青睐，概括起来有如下⼏个⽅⾯的原因：(1)可以很⼤程度上避免内⽣性问题的困扰：政策相对于微观经济主体⽽⾔⼀般是外⽣的，因⽽不存在逆向因果问题。此外，使⽤固定效应估计⼀定程度上也缓解了遗漏变量偏误问题。(2)传统⽅法下评估政策效应，主要是通过设置⼀个政策发⽣与否的虚拟变量然后进⾏回归，相较⽽⾔，双重差分法的模型设置更加科学，能更加准确地估计出政策效应。(3)双重差分法的原理和模型设置很简单，容易理解和运⽤，并不像空间计量等⽅法⼀样让⼈望⽽⽣畏。(4)尽管双重差分法估计的本质就是⾯板数据固定效应估计，但是DID听上去或多或少也要⽐OLS、FE之流更加“时尚⾼端”，因⽽DID的使⽤⼀定程度上可以满⾜“虚荣⼼”。

在细致介绍DID之前⾸先强调⼀点，⼀般⽽⾔，DID仅适⽤于⾯板数据，因此在只有截⾯数据时，还是不要浪费⼼思在DID上了。不过，事⽆绝对，在某些特殊的情景下，截⾯数据通过巧妙的构造也是可以运⽤DID的，⼤神Duflo曾经就使⽤截⾯数据和DID研究了南⾮的养⽼⾦计划项⽬对学前⼉童健康的影响，感兴趣的可以去搜搜⼤神的⽂章。

具体来说，基准的DID模型设置如下：

其中，du为分组虚拟变量，若个体i受政策实施的影响，则个体i属于处理组，对应的du取值为1，若个体i不受政策实施的影响，则个体i属于对照组，对应的du取值为0。dt为政策实施虚拟变量，政策实施之前dt取值为0，政策实施之后dt取值为1。du·dt为分组虚拟变量与政策

实施虚拟变量的交互项，其系数就反映了政策实施的净效应。

从DID的模型设置来看，要想使⽤DID必须满⾜以下两个关键条件：⼀是必须存在⼀个具有试点性质的政策冲击，这样才能到处理组和对照组，那种⼀次性全铺开的政策并不适⽤于DID分析；⼆是必须具有⼀个相应的⾄少两年(政策实施前后各⼀年)的⾯板数据集。

为什么交互项du·dt的系数

就能够体现出政策的净效应呢？这⼀点可以通过下表来体现(下表也反映了双重差分法五个字的真正含

义)：

双重差分法的基本思想就是通过对政策实施前后对照组和处理组之间差异的⽐较构造出反映政策效果的双重差分统计量，将该思想与上表的内容转化为简单的模型(1)，这个时候只需要关注模型(1)中交互项的系数，就得到了想要的DID下的政策净效应。

更进⼀步地，DID的思想与上表的内容可以通过下图来体现：

图中红⾊虚线表⽰的是假设政策并未实施时处理组的发展趋势。事实上，该图也反映出了DID最为重要和关键的前提条件：共同趋势(Common Trends)，也就是说，处理组和对照组在政策实施之前必须具有相同的发展趋势。DID的使⽤不需要什么政策随机以及分组随机，只要求CT假设，因此⽤DID做论⽂时必须对该假设进⾏验证，⾄于具体怎么验证，后⾯再说。

现代农业科技很多时候，⼤家在看使⽤DID的⽂献时，会发现别⼈的基准模型和模型(1)并不完全⼀致，别⼈的模型如下：

别⼈的模型⾥只有交互项du·dt，⽽缺失了du和dt，是哪⾥出问题了么？并没有，模型(1)和(2)本质还是⼀样的，且模型(2)在多年⾯板数据集⾥更为常见。模型(2)中，

为个体固定效应，更为精确地反映了个体特征，替代了原来粗糙的分组变量du；

为时间固定效应，更为精确地反映了时间特征，替代了原来粗糙的政策实施变量dt。因⽽，du和dt并未真正从模型中消失，只是换了个马甲。模型(2)事实上就是⼀个双向固定效应模型，这也是为什么DID⽅法⼀定程度上可以减轻遗漏变量偏误的原因(主要是消除那些不可观测的⾮时变因素，为了使估计结果尽可能准确，模型中还是要加⼊控制变量)。

在介绍完DID的基本思想和模型设定后，现在要开始强调同等重要的内容，那就是稳健性检验——必须证实所有效应确实是由政策实施所导致的。很多⼈对这⼀点并不重视，认为DID很简单，随便跑⼏个回归就可以写出⼀篇⼤作了。关于DID的稳健性检验，主要表现在两个⽅⾯：

七台河市高级中学(1)共同趋势的检验。这个假设是⽐较难验证的，看⽂献时会发现别⼈经常没有做该检验，⽐如，很多⼈做DID时只有政策实施前后各⼀年的数据，这样的的话根本⽆法验证政策实施前的趋势问题。不过，如果是多年的⾯板数据，可以通过画图来检验CT假设，之前推荐的那篇AER⽂章就画了⼤量的图形对此进⾏了说明。

(2)即便处理组和对照组在政策实施之前的趋势相同，仍要担⼼是否同时发⽣了其他可能影响趋势变化的政策，也就是说，政策⼲预时点之后处理组和对照组趋势的变化，可能并不真正是由该政策导致的，⽽是同时期其他的政策导致的。这⼀问题可以概括为处理变量对产出变量作⽤机制的排他性，对此，可以进⾏如下的检验：

A.安慰剂检验，即通过虚构处理组进⾏回归，具体可以：a)选取政策实施之前的年份进⾏处理，⽐如原来的政策发⽣在2008年，研究区间为2007-2009年，这时可以将研究区间前移⾄2005-2007年，并假定政策实施年份为2006年，然后进⾏回归；b)选取已知的并不受政策实施影响的组作为处理组进⾏回归。如果不同虚构⽅式下的DID估计量的回归结果依然显著，说明原来的估计结果很有可能出现了偏误。

B.可以利⽤不同的对照组进⾏回归，看研究结论是否依然⼀致。

C.可以选取⼀个完全不受政策⼲预影响的因素作为被解释变量进⾏回归，如果DID估计量的回归结果依然显著，说明原来的估计结果很有可能出现了偏误。等等。

差分法的局限

经济学家常关⼼某政策实施后的效应，⽐如对于收⼊的作⽤。最简单的做法是⽐较处理组(即受政策影响的地区或个体)的前后差异，这称

为“差分估计量”(difference estimator)，即将处理组(treatment group)政策实施后的样本均值，减去政策实施前的样本均值。然⽽，由于宏观经济环境也随时间⽽变(时间效应)，故政策实施地区的前后差异未必就是处理效应(treatment effects)。

双重差分法

为了解决差分法的局限性，常⽤⽅法是寻适当的控制组(control group)，即未实施政策的地区，作为处理组的反事实(counterfactual)参照系。具体来说，可将未受政策影响的控制组之前后变化视为纯粹的时间效应，即

综合以上两个差分，即将处理组的前后变化减去控制组的前后变化，可得到对于政策处理效应更为可靠的估计：中国第四军医大学

这就是所谓的双重差分估计量(Difference in Differences，简记DD或DID)，因为它是处理组差分与控制组差分之差。该法最早由Ashenfelter(1978)引⼊经济学，⽽国内最早的应⽤或为周黎安、陈烨(2005)。⼀般双重差分回归

更⼀般地，可在⾯板模型中加⼊个体固定效应、时间固定效应，以及其它控制变量：

其中，为个体固定效应，为时间固定效应，为⼀系列控制变量，⽽为暂时性冲击(transitory shock)。

不难看出，上式就是“双向固定效应模型”(two-way fixed effects)，因为它既包括个体固定效应()，也包括时间固定效应()；只不过多了双重差分法的关键变量，即交互项(政策虚拟变量：policy dummy)。在具体回归中，个体固定效应可通过加⼊个体虚拟变量来实现(即LSDV法，或进⾏组内离差变换，within

transformation)；⽽时间效应可通过加⼊每期的时间虚拟变量(time dummies)来实现。

举个例⼦：在进⾏DID分析时，treat，post系数为负，两者的交乘项treat*post为正说明什么？

如果预计treat组在政策发⽣前的Y本来就更⾼，treat系数为正；如果预计随着时间推移，Y会提⾼，post为正；如果预计treat组随着政策发⽣后的Y⾼于untreat组，treat*post的系数为正。

如果treat系数为负，说明政策发⽣变化前的Y本来更低；post为负，意思是没有政策的话，所有样本的Y随着时间下降，treat*post的系数为正的话，说明随着政策发⽣后treat相⽐untreat组的Y下降更慢。双重差分法的假定

为了使⽤OLS⼀致地估计⽅程，需要作以下两个假定。

假定1：此模型设定正确。特别地，⽆论处理组还是控制组，其时间趋势项都是。此假定即“平⾏趋势假定”(parallel trend assumption)。

假定2：暂时性冲击与政策虚拟变量不相关。这是保证双向固定效应为⼀致估计量(consist estimator)的重要条件。

在此，可以允许个体固定效应与政策虚拟变量相关(可通过双重差分或组内变换消去，或通过LSDV法

控制)。DID允许根据个体特征()进⾏选择，只要此特征不随时间⽽变；这是DID的最⼤优点，即可以部分地缓解因 “选择偏差”(selection bias)⽽导致的内⽣性(endogeneity)。双重差分法的优越性

相对于静态⽐较法，双重差分法不是直接对⽐样本在政策前后的均值变化，⽽是使⽤个体数据进⾏回归，从⽽判断政策的影响是否具有显著的统计意义。相对于传统办法，双重差分法能够避免政策作为解释变量所存在的内⽣性问题，即有效控制了被解释变量和解释变量之间的相互影响效应。如果样本是⾯板数据，那么双重差分模型不仅可以利⽤解释变量的外⽣性，⽽且可以控制不可观测的个体异质性对被解释变量的影响。因此，双重差分法既能控制样本之间不可观测的个体异质性，⼜能控制随时间变化的不可观测总体因素的影响，因⽽能得到对政策效果的⽆偏估计。同时，我们在使⽤该⽅法时也应做到恰当运⽤，主要需注意内⽣性、控制组受影响、样本异质性及概念混淆等问题。否则将产⽣⼀定的负⾯影响，甚⾄使政策评估出现偏差乃⾄完全相反的结论(陈林、伍海军，2015)。

现代计量经济学和统计学的发展为我们的研究提供了可⾏的⼯具。倍差法来源于计量经济学的综列数据模型，是政策分析和⼯程评估中⼴为使⽤的⼀种计量经济⽅法。主要是应⽤于在混合截⾯数据集中，评价某⼀事件或政策的影响程度。

该⽅法的基本思路是将调查样本分为两组，⼀组是政策或⼯程作⽤对象即“作⽤组”，⼀组是⾮政策或⼯程作⽤对象即“对照组”。根据作⽤组和对照组在政策或⼯程实施前后的相关信息，可以计算作⽤组

在政策或⼯程实施前后某个指标(如收⼊)的变化量(收⼊增长量)，同时计算对照组在政策或⼯程实施前后同⼀指标的变化量。然后计算上述两个变化量的差值(即所谓的“倍差值”)。常⽤的倍差法主要包括双重倍差法和三重倍差法。

⼆、倍差法的评价⽅法框格法

DID=(((Y_1 ) ?│D=1)-((Y_0 ) ?│D=1))-(((Y_1 ) ?│D=0)-((Y_0 ) ?│D=0))绘图法

回归法

关于回归法，⼩编主要以双重倍差法和三重倍差法为例进⾏介绍。三、双重及三重倍差法双重倍差法

实验效果需要⼀段时间才能显现，⾸先考虑两期⾯板数据：

y_it=α+γD_t+βx_it+μ_i+ε_it (i=1,…,n;t=1,2)

其中D_t为试验期虚拟变量(D_t=1，若t=2，表⽰的是试验后；D_t=0，若t=1，表⽰实验前)，μ_i为不可观测的个体特征。政策虚拟变量(policy dummy)

当t=1时，实验组与控制组并未受到任何不同对待，处于相同的环境中，x_it都等于0；当t=2时，实验组x_it=1，⽽控制组x_it=0；

由于是⾯板数据，可对原⽅程进⾏⼀阶差分，消除μ_i，得到

y_t= γ+ βx_i2+ε_i

⽤OLS(普通最⼩⼆乘法)估计上式，可得⼀致估计。根据与差分估计量同样的推理：

由此得出的统计量β ?_OLS被称为“双重差分估计量”，

此估计⽅法就是双重倍差法。双重倍差法估计量如下图所⽰：

续作指南

对于双重倍差估计量，也可以引⼊其他解释变量{z_i1，…〖，z〗_iK }。

⼀阶差分后的⽅程表⽰为：

y_t= γ+ βx_i2+δ_1 z_i1++δ_K z_iK+ε_i微波天线

注：此时的被解释变量的双重差分法不适⽤于多期数据。

在两期数据的假设下，上述⽅程与下⾯的模型是等价的：

y_it=β_0+β_1G_i?D_t+β_2 G_i+γD_t+ε_it (i=1,…,n;t=1,2)

其中，G_i为实验组虚拟变量(G_i=1，属于实验组；G_i=0，属于控制组)，即是分组虚拟变量，主要是刻画实验组和控制组本⾝的差异；

D_t为实验期虚拟变量(〖若t=2，D〗_t=1；若t=1，D_t=0)，即是时间虚拟变量，⽤来刻画实验前后两期本⾝的差异；交互项G_i?

D_t=x_it(若i∈实验组，且t=2，G_i?D_t=1)；反之则为0，才真正度量实验组的政策效应。

当t=1时，⽅程可写为

y_i1=β_0+β_2 G_i+ε_i1

当t=2时，⽅程可写为

y_i2=β_0+β_1 G_i?D_2+β_2 G_i+γ+ε_i2

上述两个式⼦相减

y_t=γ+β_1 G_iD_2+(ε_i2-ε_i1)= γ+ βx_i2+ε_i

得到的结果双重倍差法的结果完全相同。此时β ?_1(即交互项G_i?D_t的系数)就是双重差分估计量。

双重差分法的优点在于，同时控制了分组效应G_i (group-specificeffects)与时间效应D_t (time-specific effects)

注意：倍差法是将⼲预发⽣时实验组和控制组趋势的差异归因于该⼲扰项，若是有其他因素影响两组之间的趋势差异，评价结果便会产⽣偏倚。三重倍差法

如果控制组和实验组的时间趋势不同，也就是说，γD_t的系数，控制组为γ_0，实验组的系数为γ_0+γ_1，则双重倍差法的公式应该写为：

y_it=β_0+β_1 G_i?D_t+β_2 G_i+γ_0 D_t+γ_1 G_i?D_t+ε_it

=β_0+〖(β〗_1+γ_1)G_i?D_t+β_2 G_i+γ_0 D_t+ε_it

尼龙套此时，通过OLS得到的参数估计是〖(β〗_1+γ_1)的⼀直估计，⽆法分离出对实验组的效应β_1。因此需要进⼀步改进双重差分的估计量。

@计量经济学圈

记录⼀个我们⽣活在其中的时代社会，⼀个⾮常具有潜⼒的深度与客观兼具的⼤号，囊括的主题如下：经济、社会、历史、新闻、世界、计量⼯具。

本文发布于:2024-09-21 12:39:32，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/358748.html

上一篇：什么叫差分信号差分信号详解

下一篇：双重差分法之空间DID

标签：政策双重变量实施效应差分法

留言与评论（共有 0 条评论）