工具变量在社会科学因果推断中的应用

⼯具变量在社会科学因果推断中的应⽤
陈灿⼀、导⾔: 因果推断的圣杯
证券经纪人管理暂行规定
在反事实因果的框架之下 ,基于调查数据的社会学定量分析要进⾏因果推断,难度极⼤。其主要原因在于,社会学家⼀旦要证明某个他们所感兴趣的“因”会带来⼀定的“果”,就必须⾯对⼀个永恒挑战:“内⽣性”问题( endogeneity) 。也即: 如果某个潜在的、⽆法观测的⼲扰项,既影响“因”,⼜影响“果”,那么,利⽤最⼩⼆乘法模型( 简称OLS模型) 进⾏回归分析所得到的估计量就会是有偏误的,⽽不具有因果推断⼒。在实证分析中,⽆论是经典的教育回报研究( Card, 1999),还是我国学界⾮常关注的关系⽹、社会资本研究( Mouw, 2003, 2006; 松、范晓光,2010,2011) ,内⽣性问题都极为重要且亟待解决。
解决内⽣性问题的常⻅⽅法,主要包括⼯具变量( instrumental variable,简称IV) 、固定效应模型( fixed effects model,简称FE) 、倾向值匹配( propensity score
matching,简称PSM) 、实验以及准实验( experimentsand quasi-experiments) 等等。近年来,其中不少⽅法已经逐步在我国社会学界得到评述和应⽤( 梁⽟成, 2010; 松、范晓光, 2010, 2011; 松, 2012; 胡安宁,2012; 魏万⻘,2012) 。 在反事实因果分析框架下,实验或准实验⽅法最切近要义。但社会科学的很多研究主题和领域决定了⽆法使⽤实验⽅法,⽽其他⽅法也都具有较⼤的局限性。如固定效应模型只能消除时间固定的⼲扰项,倾向值匹配⽅法则完全依赖于“可观测因素被忽略”的
诺顿2013
假说。相⽐较⽽⾔,对基于调查数据的定量分析,⼯具变量⽅法具有独特优势。不过,⼯具变量⽅法在社会学分析中的运⽤,⽬前却远远不如它在计量经济学和政治学定量分析中那么⼴受⻘睐( 政治学和计量经济学研究中⼯具变量⽅法的使⽤参⻅Sovey & Green,2011; Angrist et al., 1996; Angrist & Krueger, 2001) 。
东莞pm2.5
但是,近10 年来社会学界对于⼯具变量的态度,正在由不熟悉、犹豫不决向着逐步接纳⽽转型。10 年前,康奈尔⼤学的摩根有感于⼯具变量⽅法得不到社会学家⻘睐⽽专⻔写成⼀篇《社会学家该不该⽤⼯具变量》的⽂章( Morgan,2002) 。整整10 年后,美国《社会学年鉴》( Annual Review of Sociology) 专⻔刊出了博伦关于⼯具变量在社会学分析中应⽤的综述( Bollen,2012) 。这篇重要论⽂从技术⻆度详细回顾了2000—2009 年间在美国三⼤顶级社会学刊物( American SociologicalReview,American Journal of Sociology,以及Social Forces) 刊发的57 篇采⽤⼯具变量⽅法的论⽂。毫⽆疑问,⼯具变量⽅法逐步被社会学界关注和接纳的过程,充分展示了社会学定量分析⽅法的演进以及与其他学科在⽅法论上的进⼀步融合。
那么,何以说⼯具变量是定量分析中因果推断的“圣杯”? 这是因为,好的⼯具变量⾮常难以寻觅,寻它的逻辑和数据挖掘过程充满艰⾟、难以驾驭,甚⾄往往需要研究者的灵感。但它在模型上的简洁性,它对社会科学想象⼒、逻辑⼒和诠释⼒的要求,既为定量分析提供了因果推断的重要武器,也让分析的过程充满趣味和奇思妙想。本⽂将以尽量浅显的语⾔,总结回顾⼯具变量的原理、来源、分类
和特性,并结合具体分析案例,勾勒⼯具变量⽅法的实施步骤和诠释要点。本⽂是当前社会学⽂献中⾸次对⼯具变量进⾏梳理和分类的尝试,也是⽬前我国社会学定量分析领域第⼀次对⼯具变量的全⾯介绍、评述和案例展示。
⼆、⼯具变量的原理:模型之外的⼒量
氯化镁⼯具变量的原理最早由菲利普·莱特( Philip G. Wright) 在上世纪20 年代末提出( Stock & Trebbi, 2003) ,这⾥仅作扼要介绍和基本的模型推演。⾸先,我们给出⼀个典型的线性回归模型:
这⾥y 为因变量,也即“果”;x1为⾃变量,或者解释变量,也即“因”。⼤写的X 为外⽣控制项向量( 也即⼀组假定为外⽣的其他控制变量,例如年龄、性别等等), 则为误差项。如果 与x1不相关,那么我们可以利⽤OLS 模型对⽅程进⾏⽆偏估计。然⽽,如果⼀个重要变量x2被模型( 1) 遗漏了,且x1和x2也相关,那么对 的OLS 估计值就必然是有偏的。此时,x1被称作“内⽣”的解释变量,这也就是著名的“内⽣性”问题。
要解决这⼀内⽣性问题,我们需要引⼊更多信息来进⾏⽆偏估计。⼯具变量的⽅法就是引⼊⼀个外⽣变量Z,且Z 必须满⾜以下两个条件: 与 不相关,但与x1相关。或者说,Z 仅仅通过影响x1来影响y。这样,根据⼯具变量的必备条件,我们可以得到:
由⽅程( 1) 我们可以推导出:
再根据⽅程( 2) 和X 是外⽣向量的假设,我们得到Cov ( Z,y)= Cov ( Z,x1),也即:
故此,我们可以对 进⾏⽆偏估计:
⽅程( 3) ⾥的 ,也就是⼯具变量估计量。
如果⽤上述公式还不能直观清晰地表达⼯具变量的原理,那么我们可以⽤下⾯的示意图来做⼀简要说明。在图1 中,模型的范围⽤虚线框来表示。⼯具变量Z 处于模型之外( 也即在虚线框之外) ,因此是
完全外⽣的 。 此时,⼯具变量Z 只能通过影响⾃变量x1⽽间接影响因变量y。如果⼯具变量Z 和⾃变量x1密切相关,那么,只要⼯具变量Z 有了
增量变化,就必然会对⾃变量x1产⽣⼀个来⾃模型之外的冲击。如果⾃变量x1和因变量y 之间真的存在因果关系,那么Z 对x1带来的冲击也就势必传递到y。这样,在⼀系列的假说之下,只要Z 对y 的间接冲击能够被统计证明是显著的,我们就可以推断出x1对y 必然有因果关系。利⽤对Z 与x1相关的估算,以及Z 与y 的间接相关的估算,理论上我们就可以推导出x1和y 之间真实关系的⼤⼩ 。因此,图1 ⾮常清晰地展示了⼯具变量的原理: 利⽤来⾃模型之外的外⽣差异进⾏⽆偏估计。
较为常⻅的⼯具变量估算⽅法是两阶段最⼩⼆乘法( two-stageleast-squares,也即2SLS) 。在回归的第⼀阶段,内⽣的因变量x1放在模型左侧,⽽右侧则为原模型中全部X 以及⼯具变量Z。然后对每⼀个x1进⾏预测赋值。在第⼆阶段,模型左侧是因变量y,右侧则为X和x1的第⼀阶段预测值。⼯具变量估计量肯定是⼀致的( 参数估计的⼀致性指当样本容量趋向⽆穷⼤时,参数估计趋近于参数真值,也就是收敛于参数真值) 。不过其估计⽅差也⽐相应的OLS 估计⽅差要⼤。⼯具变量Z 和⾃变量x1之间的关系越紧密,则估计⽅差越⼩。
要确保⼯具变量分析结果稳健可信,我们必须⾸先检验⼯具变量的合法性,同时还要观察⼯具变量模型和⼀般的单⽅程模型( 如OLS或Probit 模型) 之间的分析结果有⽆系统差异。这⾥,有⼏个⾄关重要的统计量的判别是必不可少的。( 1) Z 和x1必须是强相关。否则,就会带来弱⼯具变量问题,导致估计量有偏。在使⽤⼆阶段估计法时( 2SLS) ,⼀般我们可以依赖F 统计量来判断两者之间的关系强弱。⼀般⽽⾔,如果F 统计量⼤于经验值10,则不存在弱⼯具变量问题( Stock& Yogo,2005) 。( 2) ⼯具变量的外⽣性
是⽆法⽤统计⽅法直接验证的。不过当我们同时使⽤多个⼯具变量时( 也即模型被过度识别时overidentified) ,则可以进⾏沙根检验( Sargan Test) ; 此外,有⼀些研究会把⼯具变量直接加⼊主模型进⾏偏系数的显著性检验,不过严格意义上这⼀做法并不具有有效性。( 3) 豪斯曼内⽣性检验( Hausman Testof Endogeneity) ,⽤以检测OLS 模型和⼯具变量模型之间是否存在系统差异。如果有,
则应采纳⼯具变量估计量。( 4) 瓦尔德内⽣性检验( Wald Test of Endogeneity) ,⽤以检测单⽅程Probit 模型与IV-Probit 模型之间是否存在系统差异。如果有,则应采纳IV-Probit 模型估计量。
三、⼯具变量的寻觅极限空间下载
本部分将对⼀些经典和较具说服⼒的⼯具变量分析案例进⾏分类总结。梳理这些⼯具变量,⽐⼀般性的⽂献综述更重要,这是因为,合格的⼯具变量⾮常难以寻。因此,前⼈对某⼀类⼯具变量的使⽤,在很⼤程度上对我们今后寻⼯具变量能够带来重要启发甚⾄灵感:严密的逻辑和辽远的想象⼒,是寻到好的⼯具变量的必要条件 。
(⼀)来⾃“分析上层”的⼯具变量:集聚数据
经济学和社会学中⼀个⾮常热⻔的研究课题是同侪效应( peereffect) 。其假说是,个⼈的经济社会结果,往往会受到所在集体的某个特征要素的影响。⽐如,⼀个⼈的成绩、收⼊、社会地位等等,会受到他所在的学校、班级、邻⾥的特征的影响。但要验证这⼀假说,我们就必须解决个⼈异质性导致的内⽣性问题。这是因为,很多⽆法观测到的个⼈、家庭因素,会同时和个⼈结果与我们关⼼的集体要素相关( 特别是,个体往往根据⾃⼰的某项特质和偏好来选择学校、选择班级、选择邻居) 。为解决这⼀内⽣性问题,经济学家和社会学家常常把州、县或⼤都会地区层⾯的集聚数据( aggregation data) 作为学校、班级和邻⾥等层⾯解释变量的⼯具变量( ⽂献回溯参⻅Card & Krueger,1996) 。例如,
埃⽂斯等( Evans et al. ,1992) 试图验证学校中的贫困⽣⽐例对学⽣怀孕或辍学⾏为是否有显著影响。他们运⽤⼤都会地区的失业率、家庭收⼊中位数和贫困率作为学校中贫困学⽣⽐例的⼯具变量。其理由是: 以都会为单位的失业率和贫困率必然和辖区内学校的贫困⽣⽐例有关,但⼜不直接影响学⽣的怀孕或辍学等⾏为。邦托利阿等( Bentolila et al., 2010) 使⽤联邦就业率作为⼯具变量来分析“使⽤社会关

本文发布于:2024-09-20 13:54:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/686100.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:变量   模型   分析   社会学   研究
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议