stata中汇报选项设定

stata中汇报选项设定
初始回归方程:mpg=β0+β1turn+β2gear_ratio+μ
内生变量:turn=z0+z1weight+z2length+z3headroom+ε
回归方程中内生变量为turn,工具变量为weight、length、headroom。
2SLS估计
1.使用ivreg2进行2SLS估计
ivreg2 mpg gear_ratio(turn=weight length headroom)
这里运行时出现错误提示:
括号不平衡问题.png讲道集
原因:括号前面要有个空格。
ivreg2.png
结果显示:
turn变量的估计系数是-1.246,z检验值为-6.33,p值0.000,小于0.05,说明turn系数显著,且与mpg呈现负相关。
Underidentification test,方程的不可识别检验详解,得到LM统计值为26.822,p值=0.000,小于0.05,强烈拒绝“不可识别”的原假设。
Weak identification test弱工具变量检验详解,得到得到Wald-F统计值为30.303,KP Wald-F统计值为42.063,大于所有临界值,说明拒绝“弱工具变量”的原假设,即方程不存在弱工具变量。
Hansen J statistic的过度识别检验详解,得到卡方统计值为0.548,p值为0.7601,大于0.05,说明接受“过度拟合”的原假设;【Hansen J统计量,加选项robust时汇报Hansen J统计量,不加robust选项时汇报Sargan统计量。也就是说iid时用Sargan统计量,非iid时用Hansen J统计量。】
如果是恰好识别,是不用做过度识别检验的。如果工具变量个数多于内生变量个数,且确复配食品添加剂通则
定其中一个工具变量外生,就可以进行过度识别检验。过度识别检验p值大于0.1,则不拒绝所有工具变量均外生的原假设。
Sargan+Hansen:过度识别检验及Stata实现
在计量经济学方法研究以及应用中,一般需要恰好识别或者过度识别,虽然过度识别的情况比较多一些,另外这是进行工具变量法的必要条件;若是出现过度识别,则需要进行过度识别检验,也成为萨尔干巴斯曼检验,写作Sargan-Basman检验。
该假设的条件为所有有效的工具变量的个数与内生解释变量一样多,或者说是这个所有的工具变量都是外生的。
过度识别的命令为estat overid
若是Sargan-Basman检验的统计量对应的p值大于0.05,则认为所有的工具变量都是外生的,也就是有效的,反之则是无效的。(原假设是所有工具变量是外生的,若是p值小于0.05,则拒绝原假设)
男性性工作者
对路网总结:过度识别检验其实一部分是为了检验工具变量的外生性,主要体现在检验工具变量是否与扰动项的相关性,即与扰动项不相关。
过度内生性检验
ivreg2 mpg gear_ratio(turn=weight length headroom)
estimates store iv
regress mpg gear_ratio turn weight length headroom
estimates store ols
hausman iv ols,constant sigmamore
4zjbGT.png
Hausman检验得到统计值为-0.97,无法拒绝“所有解释变量均为外生”的原假设,说明方程存在内生性。
注释:
用IV做2SLS回归时,需要对IV进行三个方面的检验:
1.不可识别检验,也就是IV的个数是否少于内生解释变量的个数,使用的统计量是Anderson LM统计量/Kleibergen-Paap rk LM统计量。这里p值小于0.01说明在1%水平上【说明错误拒绝的可能性小于1%】显著拒绝“工具变量识别不足”的原假设,也就是要求p值不能大于0.1。
加robust是Kleibergen-Paap rk LM统计量,不加robust是Anderson LM统计量。也就是说在iid(独立同分布)情况下看Anderson LM统计量,在非iid情况下看Kleibergen-Paap rk LM统计量。
2.弱IV检验,弱IV是指IV与内生解释变量的相关性不强,微弱相关,弱IV会导致用IV估计的结果与用OLS,FE估计的结果相差很大,甚至符号完全相反。如果有较多工具变量,可舍弃弱工具变量,因为多余的弱工具变量反而会降低第一阶段回归的F统计量。弱IV的判断有以下四个标准:(1)偏R2,也就是Shea's partial R2,不过xtivreg2不汇报这个统计量,得用命令estat firststage,all forcenonrobust
汇报第一阶段的结果。
ctd
(2)最小特征统计量,minimum eigenvalue statistic,这是Stock and Yogo(2005)提出来的,stata会在ivreg2中给出临界值。Staiger and Stock(1997)建议只要该值大于10就认为不存在弱IV。这个值用于iid的情况。
(3)Cragg-Donald Wald F统计量,由Cragg and Donald(1993)提出,Stock and Yogo(2005)给出其临界值,Stata在回归时会给出临界值。CDW检验一般过15%,10%的临界值就可以,过了5%的临界值更好。名义显著性水平为5%的检验,其真实显著性水平不超过15%。也就是Stock-Yogo weak ID test critical values的15%相当于5%,也就是说要求CDW统计量大于15%的临界值就行。如果IV数量小于3则不会给出Stock-Yogo weak ID test critical values:5%/10%/15%/20%maximal IV relative bias。如果假设扰动项为iid,则看CDW检验统计量。如果不对扰动项作iid的假设,则看KP W rk F统计量。所以加r选项时才有KP W rk F统计量,不加则没有。不管加不加r选项,CDW统计量总有。通常建议加上r选项。

本文发布于:2024-09-23 01:33:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/645600.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:变量   检验   识别   工具
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议