一文读懂倾向匹配得分Stata及R操作应用

⼀⽂读懂倾向匹配得分Stata及R操作应⽤

本⽂将介绍Stata及R软件进⾏倾向匹配得分操作应⽤，主要包括倾向匹配得分命令简介、语法格式、倾向匹配得分操作步骤思路，涉及倾向匹配得分应⽤、平衡性检验、共同取值范围检验、核密度函数图等内容。

命令简介

Stata does not have a built-in command for propensity score matching, a non-experimental method of sampling that produces a control group whose distribution of covariates is similar to that of the treated group. However, there are several user-written modules for this method. The following modules are among the most popular:

Stata没有⼀个内置的倾向评分匹配的命令，⼀种⾮实验性的抽样⽅法，它产⽣⼀个控制组，它的协变量分布与被处理组的分布相似。但是，这个⽅法有⼏个⽤户编写的模块。以下是最受欢迎的模块（主要有如下⼏个外部命令）psmatch2.ado

pscore.ado

nnmatch.ado

psmatch2.ado was developed by Leuven and Sianesi (2003) and pscore.ado by Becker and Ichino (2002). More recently, Abadie, Drukker, Herr, and Imbens (2004) introduced nnmatch.ado. All three modules support pair-matching as well as subclassification.

You can find these modules using the command as follows:

net search psmatch2

net search pscore

net search nnmatch

You can install these modules using the .ssc or command, for example:

括地志ssc install psmatch2, replace

After installation, read the help files to find the correct usage, for example:

help psmatch2

上述主要介绍了如何获得PSM相关的命令，总结⼀下⽬前市⾯上⽤的较好的命令为psmatch2.

PSM 相关命令

help psmatch2

help nnmatch

help psmatch

help pscore

持续获取最新的 PSM 信息和程序

findit propensity score

固晶机findit matching

psmatch2 is being continuously improved and developed. Make sure to keep your version up-to-date as follows ssc install psmatch2, replace

where you can check your version as follows:

which psmatch2

2工商联章程

语法格式

语法格式为：

help psmatch2

•

psmatch2 depvar [indepvars] [ ifexp] [ inrange] [, outcome(varlist) pscore(varname) neighbor( integer) radius caliper(real) mahalanobis(varlist) ai( integer) population altvariance kernel llr kerneltype( type) bwidth(real) spline nknots( integer) common trim(real) noreplacement descending odds index logit ties quietly w(matrix) ate]

选项含义为：

depvar因变量；

indepvars表⽰协变量；

outcome(varlist)表⽰结果变量；

logit指定使⽤logit模型进⾏拟合，默认的是probit模型；

张茜倩

neighbor(1)指定按照1:1进⾏匹配，如果要按照1:3进⾏匹配，则设定为neighbor(3)；

radius表⽰半径匹配

核匹配 (Kernel matching)

其他匹配⽅法

⼴义精确匹配(Coarsened Exact Matching) || help cem

局部线性回归匹配 (Local linear regression matching)

样条匹配 (Spline matching)

马⽒匹配 (Mahalanobis matching)

pstest $X, both做匹配前后的均衡性检验，理论上说此处只能对连续变量做均衡性检验，对分类变量的均衡性检验应该重新整理数据后运⽤χ2检验或者秩和检验。但此处对于分类变量也有⼀定的参考价值。

psgraph对匹配的结果进⾏图⽰。

Stata操作与应⽤

政策背景：国家⽀持⼯作⽰范项⽬（ National Supported Work,NSW ）

研究⽬的：检验接受该项⽬（培训）与不接受该项⽬（培训）对⼯资的影响。基本思想：分析接受培训组（处理组，treatment group ）接受培训⾏为与不接受培训⾏为在⼯资表现上的差异。但是，现实可以观测到的是处理组接受培训的事实，⽽处理组没有接受培训会怎样是不可能观测到的，这种状态也成为反事实（ counterfactual ）。

全自动淘洗磁选机匹配法就是为了解决这种不可观测事实的⽅法。在倾向得分匹配⽅法（ Propensity Score Matching ）中，根据处理指⽰变量将样本分为两个组，⼀是处理组，在本例中就是在 NSW 实施后接受培训的组；⼆是对照组（ comparison group ），在本例中就是在 NSW 实施后不接受培训的组。倾向得分匹配⽅法的基本思想是，在处理组和对照组样本通过⼀定的⽅式匹配后，在其他条件完全相同的情况下，通过接受培训的组（处理组）与不接受培训的组（对照组）在⼯资表现上的差异来判断接受培训的⾏为与⼯资之间的因果关系。

1、⾸先进⾏数据结构查看

•

use"ldw_exper.dta", clear ed desc

结果为：

2、描述性分析

•

tabulatet, summarize(re78) means standard

结果为：

3、倾向匹配得分

3.1 ⾸先进⾏排序，⽣成随机数种⼦

•

setseed20180105//产⽣随机数种⼦ gen u=runiform sortu //排序或者 orderu 3.2 倾向匹配得分

•

职来职往第66期刘璐

•

local v1 "t" local v2 "age edu black hisp married re74 re75 u74 u75" globalx "`v1' `v2' " psmatch2 $x, out(re78) neighbor( 1) ate ties logit common // 1:1 匹配$表⽰引⽤宏变量，等价于 psmatch2 t age edu black hisp married re74

re75 u74 u75, out(re78) neighbor( 1) ate ties logit common 结果为：3.3 查看匹配后数据结果为：打开数据编辑窗⼝，会发现软件⾃动⽣成了⼏个新变量：其中_pscore是每个观测值对应的倾向值；_id是⾃动⽣成的每⼀个观测对象唯⼀的ID（事实上这列变量即是对_pscore排序）；_treated表⽰某个对象是否试验组；_n1表⽰的是他被匹配到的对照对象的_id（如果是1:3匹配，还会⽣成_n2, _n3）；_pdif表⽰⼀组匹配了的观察对象他们概率值的差。3.4 均衡性检验 pstest $v2, both graph结果为：3.5 共同取值范围 psgraph结果为：3.6 核密度函数图 twoway(kdensity _ps if_treat==

1,legend(label( 1"Treat")))(kdensity _ps if_treat== 0, legend(label( 2"Control"))),xtitle(Pscore > ) title( "Before Matching") . twoway(kdensity _ps if_treat== 1,legend(label( 1"Treat")))(kdensity _ps if(_weight!= 1&_weight!=.), legend(label( 2"Control"))), > xtitle(Pscore) title( "After Matching") 结果为：3 R操作与应⽤描述：这是国家⽀持⼯作⽰范(NSW)处理组数据的⼦样本和当前⼈⼝调查(CPS)的⽐较样本。Lalonde(1986)、Dehejia和Wahba(1999)对这些数据进⾏了⼴泛的分析。R软件操作倾向匹配得分的函数安装包⽐较多，下⾯介绍⼀种，叫做 Matching，其他的还有MatchIt等。使⽤ Matching前，需要先进⾏安装：install.packages(“ Matching”)就可以安装了。 1、⾸先进⾏数据查看 >

data(" lalonde") > summary( lalonde) ageeducblackMin. :17.00Min. : 3 .0Min. :0.00001 stQu. :20.001 stQu.: 9 .01 stQu. :1.0000Median:24.00Median:10.0Median:1.0000Mean:25.37Mean:10.2Mean:0.83373 rdQu. :28.003 rdQu. :11.03 rdQu. :1.0000Max. :55.00Max. :16.0Max. :1.0000hispmarriedMin. :0.00000Min. :0.00001 stQu. :0.000001 stQu.

:0.0000Median:0.00000Median:0.0000Mean:0.08764Mean:0.16853 rdQu. :0.000003 rdQu. :0.0000Max. :1.00000Max. :1.0000nodegrre74Min. :0.000Min. : 0 .01 stQu. :1.0001 stQu.: 0 .0Median:1.000Median: 0 .0Mean:0.782Mean: 2102 .33 rdQu. :1.0003 rdQu.: 824 .4Max. :1.000Max. :39570.7re75re78u74Min. : 0 Min. : 0 Min. :0.00001 stQu.: 0 1 stQu.: 0 1 stQu. :0.0000Median: 0 Median: 3702 Median:1.0000Mean: 1377 Mean: 5301 Mean:0.73263 rdQu.: 1221 3 rdQu.: 8125 3 rdQu. :1.0000Max. :25142Max. :60308Max. :1.0000u75treatMin. :0.0000Min. :0.00001 stQu. :0.00001 stQu.

:0.0000Median:1.0000Median:0.0000Mean:0.6494Mean:0.41573 rdQu. :1.00003 rdQu. :1.0000Max. :1.0000Max.

:1.0000> View( lalonde) 结果为：数据介绍：包含对以下12个变量的445个观察值。age表⽰年龄educ：

受教育年限black：是否为⿊⼈hispan：是否为西班⽛裔married：是否已婚nodegree：是否没有毕业⽂凭。re74，1974年的实际收⼊。re75，1975年的实际收⼊。re78，1978年的实际收⼊。u74，1974年的收⼊指标变量为零。u75，1975年收⼊的指标变量为零。treat：是否接受职业培训。2、估计倾向匹配模型 glm1<- glm(treat~age + I(age^2) + educ + I(educ^2) + black +hisp+ married + nodegr + re74 + I(re74^2) + re75 + I(re75^2) +u74 + u75, family= binomial, data=lalonde)3、保存数据对象 X<- glm1$fittedY<- lalonde$re78Tr<- lalonde$treat3、⼀对⼀匹配，评估处理效应的影响(“estimand”选项默认为ATT)。 rr < -Match( Y= Y,Tr= Tr,X= X,M= 1);summary( rr) 结果为：4、我们来看看协变量的平衡性，为了提⾼速度，nboots被设置为较⼩的值。正式分析时提⾼到⾄少500。 mb < -MatchBalance( treat~ age+ I( age^ 2) + educ+ I( educ^ 2) + black+ hisp+ married+ nodegr+ re74+ I( re74^ 2) + re75+ I( re75^ 2) + u74+ u75, data= lalonde,match.out= rr,nboots= 10)结果为：

本文发布于:2024-09-21 21:48:13，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/44335.html

上一篇：统计与R软件论文

下一篇：RStudio介绍及入门

标签：匹配倾向得分接受培训

留言与评论（共有 0 条评论）