多期双重差分法(DID)的Stata操作

多期双重差分法(DID)的Stata操作
如果政策实施时点⼀致的话,那么我们就可以使⽤标准DID愉快地玩耍了。但是,更多情况下,政策实施时点是不⼀致的,这时候就该多期DID粉墨登场了。在多期DID模型中,因为不同个体实施政策的时点(period)不同,所以政策分期变量会变成(注意下标)。与标准DID⼀样,我们需要⽣成地区维度的政策分组变量treat和时间维度的政策分期变量period,交互项treat×period的系数反映的就是经过政策实施前后、处理组和控制组两次差分后所得到的政策效应。那么,如何在Stata中实现多期DID的操作呢?让我们看⼀个经典的案例!
数据说明
贾瑞雪⽼师(2014)的论⽂《The Legacies of Forced Freedom: China’s Treaty Ports》是⼀篇经典的计量史学论⽂,《Review of Economics and Statistics》官⽹上公布了这篇论⽂的数据和代码,接下来我就使⽤作者公布的数据和代码跟⼤家分享⼀下多期DID的Stata操作。
Replication Data for: Ruixue Jia . The Legacies of Forced Freedom: China's Treaty Ports[J]. Review of
Economics and Statistics, 2014, 96(4):596-608.
射频等离子体建议⼤家在看下⾯的内容之前,最好先看⼀下“殖民的遗产:通商⼝岸给近现代中国带来了什么?”这篇
推⽂,这样可能理解起来更加顺畅。
识别策略
清朝末期,清政府与西⽅列强签订了⼀系列不平等条约,开放沿江沿海等城市作为通商⼝岸即是不平等条约的主要内容之⼀。贾瑞雪⽼师(2014)将近代通商⼝岸的设置作为⼀项准⾃然实验,评估了通商⼝岸对中国近现代⼈⼝和经济发展的长期影响。
从1840年⾄1910年,中国⼀共被迫开放了40多个通商⼝岸。不同通商⼝岸开放的时间(政策时点)是不同的,例如,⼴州、福州、厦门、宁波和上海是在1842年《南京条约》后开放的,汉⼝、九江、南京、镇江等城市是在1858年《天津条约》后开放的,⽽苏州、杭州等城市是在1895年《马关条约》后开放的......
地区年份开放年份treat period treat×period
苏州府177********
苏州府182********对羟基苯甲醛
踏雪而归苏州府185********
苏州府188********
苏州府19101896111
苏州府19531896111
苏州府19641896111
苏州府198********
苏州府199********
苏州府20001896111
......
嘉兴府1776.000
china 农村妇女nomex
嘉兴府1820.000
嘉兴府1851.000
嘉兴府1880.000
嘉兴府1910.000
嘉兴府1953.000
嘉兴府1964.000
嘉兴府1982.000
嘉兴府1990.000
嘉兴府2000.000
ldc1000如上表所⽰,苏州府是在1896年被开放为通商⼝岸的,所以苏州府的政策分期变量period在1896年之后取值为1,之前取值为0;⽽同处苏杭地区的嘉兴府则⼀直没有被开放为通商⼝岸,所以嘉兴府的政策分组变量treat和政策分期变量period⼀直取值为0。
乃堆拉山口事实上,我们可以发现交互项treat×period的取值和政策分期变量period的取值是⼀⽑⼀样的,所以在多期DID中,我们其实就没有必要去⽣成什么交互项,只需⽤⼀个政策虚拟变量予以替代就可以了,
⽤以表⽰地区在期是否实施政策。当然,如果为了便于理解的话,可以尝试去⽣成交互项,结果都⼀样滴!
Stata操作
多期双重差分法(DID)的Stata操作可以分为如下两步:
(1)我们需要⽣成⼀个政策虚拟变量post_cmc,⽤以表⽰地区在期是否被开放为通商⼝岸。我们只需⽐较样本各期时间与开放时间(政策时点)即可,如果是在政策时点后,则取值为1,否则为0。
gen post_cmc=(year>cmcyear)
对于像嘉兴府这样未被开放为通商⼝岸的控制组个体,其开放时间是缺失的,Stata中将缺失值定义为⽆穷⼤,所以政策虚拟变量post_cmc会⼀直取值为0。
(2)使⽤被解释变量⼈⼝增长率AnnualGrowth对政策虚拟变量post_cmc进⾏回归(加⼊个体固定效应和时间固定效应,⽤以更为精确地反映个体特征和时间特征),政策虚拟变量post_cmc反映的就是通商⼝岸的设置对近现代⼈⼝增长的影响。
DID模型与固定效应模型有着千丝万缕的关系,和之前⼀样,多期DID的Stata命令主要有三个,分别是reg命
令、xtreg命令和reghdfe命令。reg命令使⽤的估计⽅法最⼩⼆乘虚拟变量⽅法(LSDV),通过在回归⽅程中引⼊虚拟变量来代表不同的个体,可以起到和固定效应组内估计⽅法(FE)同样的效果(已经被证明),贾瑞雪⽼师使⽤的就是reg命令。
reg AnnualGrowth post_cmc $control_fe i.ar, vce(cluster id)
xtreg,fe是固定效应模型的官⽅命令,使⽤这⼀命令估计出来的系数是最为纯正的固定效应估计量(组内估计量),所以对于⾯板数据的DID模型,我们使⽤更多的是xtreg,fe命令。
xtset id year
xtreg AnnualGrowth post_cmc $control_ar,fe vce(cluster id)
第三个命令是reghdfe命令,也是⼀直以来我最推荐的固定效应命令。reghdfe命令⽀持多维固定效应,运算速度快,并且不会汇报⼀⼤长串虚拟变量回归结果。
reghdfe AnnualGrowth post_cmc $control_fe, absorb(id year) vce(cluster id)

本文发布于:2024-09-21 01:24:25,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/358855.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:政策   变量   开放   通商   效应
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议