RDD:断点回归命令rdrobust(附rdbwselect、rdplot)及Stata实现

内蒙古医学院学报RDD:断点回归命令rdrobust(附rdbwselect、rdplot)及Stata实现
断点回归由Thistlewaite and Campbell(1960)⾸次使⽤,但直到1990年代末才引起经济学家的重视。Thistlethwaite、Campbell于1960年⾸次提出使⽤断点回归设计研究处理效应,在该⽂中他们的⽬的是研究奖学⾦对于
未来学业的影响, 学⽣是否获得奖学⾦取决于考试的分数。由于奖学⾦由学习成绩决定,故成绩刚好达到获奖标准与差⼀点达到的学⽣具有可⽐性。如果考试分数⼤于获奖标准分数, 则进⼊处理组;如果考试分数⼩于获奖标准分数, 则进⼊控制组。因此处理变量在获奖标准分数处形成了⼀个断点,该研究设计的主要思想是可以利⽤靠近这⼀断点附近的样本来有效估计处理效应。
钼粉
Angrist and Lavy(1999)在研究班级规模对成绩的影响时,利⽤以⾊列教育系统的⼀项制度进⾏断点回归;该制度限定班级规模的上限为40名学⽣,⼀旦超过40名学⽣(⽐如41名学⽣),则该班级被⼀分为⼆。
此后30年, 该⽅法并未引起学术界的重视,直到1990年以后, 断点回归设计开始被应⽤于各种领域,并且近年来成为因果分析和政策评估领域最重要的研究⽅法。
Hahn et al(2001)提供了断点回归在计量经济学理论基础。⽬前,断点回归在教育经济学、劳动经济学、
健康经济学、政治经济学以及区域经济学的应⽤仍⽅兴未艾。参见Imbens and Lemieux(2008),Van Der Klaauw(2008)以及Lee and Lemieux(2010)的⽂献综述。
断点回归设计是⼀种准⾃然实验, 其基本思想是存在⼀个连续变量, 该变量能决定个体在某⼀临界点两侧接受政策⼲预的概率, 由于X在该临界点两侧是连续的,因此个体针对X的取值落⼊该临界点任意⼀侧是随机发⽣的, 即不存在⼈为操控使得个体落⼊某⼀侧的概率更⼤, 则在临界值附近构成了⼀个准⾃然实验。⼀般将该连续变量X称为分组变量(assignment variable) 。
1
断点回归命令rdrobust介绍
断点回归的基本命令是rd,另外,还有⼀些其他命令,例如rdrobust、rdlocrand、rddensity等等。本⽂主要介绍rdrobust。
1、rdrobust:
rdrobust有两个配套命令:rdbwselect⽤于带宽选择,rdplot⽤于RD绘图(详细信息请参见Calonico、Cattaneo和Titiunik [2015a])。
下载安装⽅法为:百花悬念故事
欧拉定理
爱情不买单 丁酉酉
netinstall rdrobust , from ( http : //www-personal.umich.edu/~cattaneo/rdrobust) netinstall rdrobust,from(htp:// www-personal umich. edu/cattaneo/software/rdrobust/stata) replace rdrobust语法格式为: rdrobust depvar runvar [ if] [in] [, c(cutoff) p(pvalue) q(qvalue)deriv(dvalue) fuzzy(fuzzyvar [sharpbw]) covs(covars) kernel(kernelfn) weights(weightsvar) h(hvalueL hvalueR) b(bvalueL bvalueR) rho(rhovalue) scalepar(scaleparvalue) bwselect(bwmethod)
scaleregul(scaleregulvalue) vce(vcemethod) level(level) all]语法含义为:depvar可以是结果变量、原因变量或其他协变量runvar是参考变量其他可选项。c(cutoff) specifies the RD cutoff. The default is c(0).c(cutoff)⽤于设定断点位置,默认为0。 p(pvalue) specifies the order of the local polynomial used to construct the point estimator. The default is p(1) (local linear regression). p(pvalue)设定多项式阶数,默认为1,局部线性回归。 q(qvalue) specifies the order of the local polynomial used to construct the bias correction. The default is q(2) (local quadratic regression).covs(covars) 表⽰加上协变量kernel(kernelfn) specifies the kernel function used to construct the local polynomial estimators.
kernelfn may be triangular, epanechnikov, or uniform. The default is kernel(triangular).即表⽰设定多项式拟合时的核函数,kernelfn可以有三种选择:三⾓核函数 triangular、Epanechnikov核函数、矩形核函数 uniform,默认为三⾓核。
level(level)设置置信⽔平,默认为level(95).h(hvalueL hvalueR)指定主要带宽h,分别⽤在断点的左边和右边。如果只指定⼀个值,则对该值使⽤左右两边。如果没有指定,则由相应的命令rdbwselect计算带宽h。b(bvalueL bvalueR)指定在断点左侧和右侧分别使⽤的偏差调整带宽b。如果只指定⼀个值,则对该值使⽤双⽅。如果没有指定,则由相应的命
在断点左侧和右侧分别使⽤的偏差调整带宽b。如果只指定⼀个值,则对该值使⽤双⽅。如果没有指定,则由相应的命令rdbwselect计算带宽b。⼀般带宽和偏差带宽不加上,系统由相应的命令rdbwselect计算带宽。rho(rhovalue)指定的值,使得偏置带宽b等于b=h/rho。如果指定了h⽽没有指定b,那么默认值是(1)。scalepar(scaleparvalue)指定感兴趣的RD参数的调整项。当感兴趣的总体参数涉及已知的乘法时,此选项⾮常有⽤⼦(例如,sharp kink RD)。默认是scalepar(1)(没有缩放)。all表⽰程序rdrobust报告三个不同的程序:i)⽤传统⽅差估计进⾏常规RD估计;ii)使⽤传统⽅差估计器进⾏偏差校正的RD估计;和iii)带有稳健⽅差估计的偏差校正RD估计。2、rdrobust操作应⽤案例命令为: *-使⽤David S.Lee ( 2007) 参议院选举的数据 use"gitee/arlionn/data/raw/master/data01/rdrobust_rdsenate.dta", clear use"rdrobust_se
nate.dta", clear editdesc**Robust RD estimation using MSE bandwidth selection procedurerdrobust vote marginrdrobust vote margin, h( 15) 结果为:2断点回归命令rdplot介绍rdplot语法格式为: rdplot depvar runvar [ if] [ in] [, c(cutoff) p(pvalue) kernel(kernelfn) weights(weightsvar) h(hvalueL hvalueR) nbins(nbinsvalueL nbinsvalueR) binselect(binmethod) scale(scalevalueL scalevalueR) ci(cilevel) shade support(supportvalueL supportvalueR) genvars graph_options(gphopts) hide]语法含义为:c(cutoff) specifies the RD cutoff. The default is
c(0).c(cutoff)⽤于设定断点位置,默认为0。 p(pvalue) specifies the order of the local polynomial used to construct the point estimator. The default is p(1) (local linear regression). p(pvalue)设定多项式阶数,默认为1,局部线性回归。kernel(kernelfn) specifies the kernel function used to construct the global polynomial estimators. kernelfn may be triangular, epanechnikov, or uniform. The default is kernel(uniform) (that is, equal or no weighting to all observations on the support of the kernel). .即表⽰设定多项式拟合时的核函数,kernelfn可以有三种选择:三⾓核函数 triangular、Epanechnikov核函数、矩形核函数 uniform,默认为矩形核。h(hvalueL hvalueR)指定主要带宽h,分别⽤在断点的左边和右边。如果只指定⼀个值,则该值在两边都使⽤。如果指定了两个带宽,则第⼀个带宽⽤于断点左侧的带宽,第⼆个带宽⽤于断点右侧的数据。如果没有指定,则选择它来跨数据的全部⽀持。nbins(##)设定划分的区间数,提供两个数值,则分别为左右的区间数;提供⼀个数值,则断点左右
使⽤共同的区间数。ci( bilevel)可以根据设定的ci-level画出每个区间拟合点的置信区间,选加 shade置信区间⽤阴影表⽰。shade:指定可选的图形选项,以⽤阴影区域替换置信区间。support(supportvalueL supportvalueR)指定⼀个可选的扩展变量⽀持,⽤于构建容器。默认是sample范围。选项generate可以将划分的区间以及拟合的数值保存在相应的变量中rdplot_id为每个观察结果存储⼀个惟⼀的区间 ID。rdplot_N将每个观察值对应的bin中存储的观察值数量。 rdplot_min_bin存储每个观察值的下端值。 rdplot_max_bin存储每个观察值的上端值。 rdplot_mean_bin存储每个观察对应的中点位置rdplot_mean_x将运⾏变量的样本均值存储rdplot_mean_y将结果变量的样本均值存储rdplot_se_y将结果变量的平均值的标准差存储在每个观察值对应的bin中。rdplot_ci_l将结果变量的样本均值的置信区间的下端值存储在每个观察对应的bin中。 rdplot_ci_r将结果变量的样本均值的置信区间的上端值存储在每个观察对应的bin中。 rdplot_hat_y存储全局多项式估计器给出的结果变量的预测值graph_options(gphopts)绘制图形命令的图形选项。hide省略了RD图形2、rdplot操作应⽤案例命令为: *-使⽤ David S.Lee ( 2007) 参议院选举的数据 use"gitee/arlionn/data/raw/master/data01/rdrobust_rdsenate.dta", clear use"rdrobust_senate.dta", clear editdescBasic specification with titlerdplot vote margin, graph_options(title(RD plot))Quadratic global polynomial with confidence bandsrdplot vote margin, p( 2) ci( 95) shade 3断点回归命令rdbwselect介绍rdbwselect语法格式为: rdbwselect depvar runvar [ if] [in] [, c(cutoff) p(pvalue) q(qvalue)deriv(dvalue) fuzzy(fuzzyvar [sharpbw]) covs(covars) kernel(kernelfn) weights(weightsvar) bwselect(bwmethod)
scaleregul(scaleregulvalue) vce(vcemethod) all]语法含义为:c(cutoff)指定断点位置。默认值是c(0)。p(pvalue)指定⽤来构造点估计器的局部多项式的格式。默认值是p(1)(局部线性回归)。q(qvalue)指定⽤于构造偏差校正的局部多项式的阶数。默认值是q(2)(局部⼆次回归)。deriv(dvalue)指定要估计的回归函数导数的顺序。默认值是deriv(0)(如果指定了fuzzy,则为sharp RD或fuzzy RD)。默认为0,即断点回归,取1则为弯折回归设计fuzzy(fuzzyvar [sharpbw])指定⽤于实现模糊RD估计的处理状态变量(如果指定了deriv(1),则为模糊断点。默认值是sharp RD 设计。如果设置了sharpbw选项,则使⽤sharp RD模型的带宽选择过程来执⾏模糊RD估计。covs(covars)指定⽤于估计和推断的额外协变量。kernel(kernelfn)指定⽤来构造局部多项式估计的内核函数。kernelfn可以是三⾓形、epanechnikov或均匀的。默认值是内核(三⾓形)。weights(weightsvar)指定⽤于估计过程的可选加权的变量bwselect(bwmethod)指定要使⽤的带宽选择过程。具体实施⽅法见Calonico, Cattaneo, and Titiunik (2014b); Calonico, Cattaneo, and Farrell (Forthcoming); and Calonico et al. (2016)以及相关的软件⽂章。bwmethod可以是下列⽅法之⼀:mserd指定⼀个常见的均⽅误差(MSE)——⽤于RD处理效果估计的最优带宽选择器。这是默认设置。msetwo为RD处理效果估计器指定了两个不同的mse最优带宽选择器(低于和⾼于截⽌)。msesum为回归估计的和指定了⼀个通⽤的mse -最优带宽选择器(与之相对的是其差值)。msecomb1指定min(mserd, msesum)。msecomb2分别为断开的每⼀端指定中值median(msetwo、mserd、msesum)。cerrd指定⼀个常见的覆盖率错误率(CER)——⽤于RD处理效果估计器的最优带宽选择器。certwo为RD处理效果估计器指定了两个不同的ceri最优带宽选择器(低于和
⾼于截⽌)。cersum为回归估计值的和指定了⼀个通⽤的ceri -optimal带宽选择器(与之相对)。cercomb1指定min(cerrd, cersum)。cercomb2分别为边界的每⼀侧指定median(certwo、cerrd、cersum)。scaleregul(scaleregulvalue)指定添加到带宽选择器分母上的正则化项的⽐例因⼦。设置scaleregul(0)将删除来⾃带宽选择器的正则化项。默认是scaleregul(1)。vce(vcemethod)指定了⽤于计算⽅差-协⽅差矩阵估计器的过程,即标砖误差的类型。vce(vcemethod)默认是vce(nn 3).all指定rdbwselect报告所有可⽤带宽选择过程。2、 rdbwselect操作应⽤案例命令为: *-使⽤ David S.Lee ( 2007) 参议院选举的数据
湍流度
use"gitee/arlionn/data/raw/master/data01/rdrobust_rdsenate.dta", clear use"rdrobust_senate.dta", clear editdescMSE bandwidth selection procedurerdbwselect vote marginAll bandwidth selection proceduresrdbwselect vote margin, all

本文发布于:2024-09-20 17:32:17,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/614689.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:stata命令总结
下一篇:DSC分析方法
标签:指定   回归   断点   变量   带宽   估计   命令   处理
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议