倾向得分法的规范步骤和估计方法等汇总

in189本文由计量经济学服务中心综合整理自：《倾向得分匹配法的研究探索及应用》

作者：周珺

一、倾向得分的概念纳米医药

Rosebaum和 Rubin首次提出倾向得分法是在 1983 年，并定义倾向得分法为： “个体在其特定的属性下接受某种干预的可能性。”倾向得分法制造了一个“准随机”试验，在试验中，只需有两个倾向得分相同的试验对象，其中一个在处理组，而另一个在对照组，我们就可以认为处理可能性相同的两个试验对象被随机地分到了处理组与对照组。

倾向得分是所有协变量的一个函数。它将多个协变量变成一个变量，实质就是“ 降维” 。倾向得分的主要用途是来均衡处理组与对照组之间的协变量分布，对非随机化研究中的混杂因素进行类似随机化的均衡处理，其目的是减少选择性偏倚。它的基本思想是到一与处理组在所有相关的预处理特征类似的控制组，足够的与处理组比较的对照组产生的不同结果就可以归因于该项目。

二、研究现状

20 世纪 9 0 年代，倾向得分法已经成为了一种流行的方法来估计因果的处理效果，倾向得分法将被广泛用于统计分析，特别是在应用医学领域。因为随机实验的花费上涨，更多的研究者转向了做花费较少的观察性研究。通过匹配法或分层法并入倾向得分的阶段是在研究的设计阶段，这能够避免选择不适应特殊研究的个体进入到实验中，从而使倾向得分理论产生的效益最大，即在节约时间和金钱的同时能提供更精确的真实处理效应的估计。我们主张不是在观察性研究中只采用倾向得分，而是希望研究者在选择除传统的分析方法外能够运用倾向得分法。倾向得分应被当做是研究者在研究中估计处理效应时的一种可用的额外工具。fds

国际上许多领域的观察性研究中早已开始使用倾向得分法来降低选择性偏倚。在统计杂志或医学杂志的文献上，都已经有很好的例子来讨论倾向得分法。这些文章讨论的涵盖了流行病学，卫生服务研究，和社会科学经济学等领域。倾向得分法已被运用到评估劳动力市场的政策，Dehejia 等{ 1999） [20] ，实证的例子能够在其他不同领域研究中被到。Perkins 等（2 000）研究了将匹配的药物进行流行病学的分析；和 Frei（2002）分析了

网上银行客户的盈利能力；Bryson （2 002）分析了员工如果成为工会成员对其薪酬是否有影响；K im 和 Davies（2 003）通过比较被美国的一家交易所列出的加拿大公司的买卖差价百分比；H am 等（2 004）研究的跳槽对年轻男子工资增长的影响； Halaby 和 Brand（2 006）分析了影响职业的精英大学入学率的结果；每一个微型计量经济学的评估研究必须克服根本评价问题和处理可能出现的选择性偏倚。

虽然在国外倾向得分法的应用已非常广泛，被应用到各个领域的研究中，但倾向得分法在国内还处于刚起步阶段，关于倾向得分法的研究成果目前还比较少，赵守军( 2003)等采用倾向得分法来比较平衡两组间差异的变化情况，评价放弃心肺复苏急救与充血性心力衰竭患者院内死亡的联系, 并认为倾向得分法能有效地均衡组间差异，起到匹配和平衡各个特征变量的作用，并适合用于分析各种观察性研究; 汪涛( 2004)等将倾向得分法应用于一项评价某降血脂新药效果的 4 期临床试验数据后认为对于非随机化医学的研究，结合倾向指数进行非参数生存分析是一种可选择的比较新的统计方法; 高建民和陈钢( 2007)采用陕西省 2005 年度的的 2 个试点乡镇随访家庭入户调查资料，运用倾向得分匹配法对互助医疗改善卫生服务实现的可及性进行效果评价；陈玉萍等（2 010）运用倾向得分匹配法分析了滇西南农户采用改良的陆稻技术对农户收入的影响。

脉动测速

三、研究步骤

倾向得分法的应用主要有以下 7 个步骤：

（1 ）准备数据。对数据进行质量审核，鉴别数据类型，考察数据的完整性及逻辑性，根据数据类型和大小来选择相应的分析方法。

（2 ）选择协变量。针对试验目的，根据研究者的经验及倾向得分法变量的选择要求，选择合适的混杂因素。然后将混杂因素作为自变量，处理因素作为因变量进行模型的构建。从模型中获得倾向得分的估计值，这里可选的模型包括判别分析，Logistic 回归和 Probit 回归，本文之后应用的是 Probit 回归。 Probit 回归模型和 L ogistic 回归模型相同，是定性回归模型的一种，都可用来处理二分变量的回归问题。

（3 ）计算倾向得分。根据选定的模型计算每一个试验对象的倾向得分，值在 0 至 1 之间，表示试验对象被分配到试验组或对照组的概率。

（4 ）选择应用方法。根据计算出来的倾向得分，选择合适的倾向得分应用方法。常用的倾向得分法有：倾向得分匹配法（p ropensity score matching）、倾向得分加权法（p rop

ensity score weighting）、倾向得分分层法（ propensity score stratification )和倾向得分协变量调整法（p ropensity score covariate adjustment） [8] 。

（5 ）评价均衡性。应用倾向得分法前后需评价组间的均衡性好坏，协变量的均衡性好坏是衡量倾向得分法的关键。一般用来评价均衡性的好坏的方法是假设检验，标准化差异是 F lury 和 Reudwyl（1 986）提出的一种全新的评价均衡性的方法。

忻州师范学院学报（6 ）估计处理效应。对匹配后的数据集选择恰当的分析方法来估计处理效应。因匹配后的处理组和对照组之间的协变量已达到均衡，此时数据可被当做是近似随机化的，假如选择的统计分析方法是合适的就可得到真实可靠的处理效应。

（7）分析敏感性。在一次试验中，好的匹配方法产生不完整的匹配集是无法避免的，这种匹配的不精确性是很难消除的。所以，如何在匹配精度与完整度之间进行选择还有待探讨。用比较数据集在匹配前后的精确度与完整度是评价不同的匹配算法的优势是十分重要的。

四、倾向得分的估计方法

轻纺城

估计倾向得分的方法有许多种，其目的是用一个倾向得分来表示试验对象可观测到的、影响处理因素的众多协变量，然后调整试验个体倾向得分来估计处理效应。几种常见的估计倾向得分方法：

4.1 广义线性模型

广义线性模型的思想：假如对应变量作适当的变量变换可满足或近似满足线性模型分析的要求，能够借助线性模型的分析思路解决模型构造、参数估计和模型评价等一系列问题。广义线性模型包括 logistic 回归模型、非参数回归、 Probit 模型、广义可加模型等，均可被用来估计倾向得分。其中 l ogistic 回归模型是最常用也是最简单的模型，在已发表的倾向得分相关文献中，多数采用 logistic 回归模型来估计倾向得分，因为它要求因变量服从正态分布，对自变量的类型也无要求，均可引入 l ogistic 回归模型中。但在计量经济学中，更多使用依赖于正态理论的 P robit 模型。

4.2 判别分析

判别分析，是在已经明确分类的前提下，根据某一研究对象它的各种特征值来判别其应归

属于哪一类的一种多变量统计分析方法，其基本原理是按照判别准则，通过建立一个或多个判别函数，使用研究对象的大量资料从而确定判别函数中需待定的系数，并计算判别指标。据此即可确定某一样本属于何类。常用的判别分析有逐步判别分析、距离判别分析、Bayes 判别分析、 Fisher 判别分析等。在非随机化研究倾向得分计算中，判别分析也比较常用，但是它要求观察到的协变量须服从多元正态分布，这样分配出来的试验组和对照组在某种意义上来说，均衡了组间的协变量，可以获得平均处理效应的无偏估计。

本文发布于:2024-09-22 02:01:39，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/504732.html

上一篇：数据分析与SPSS软件应用(微课版)-课后习题答案1-10章全书章节练习题答案...

下一篇：多种方法校准血液分析仪结果比较与分析

标签：倾向得分研究处理模型变量匹配

留言与评论（共有 0 条评论）