为什么倾向评分匹配比单纯匹配好?
高水平的倾向性得分匹配使用以下框架:从协变量中识别潜在的混杂因素,即可能影响作为实验组一部分的受试者的所有因素Calculate Profensity Score=Pr(受试者作
解答动态
协变量)创建一个模型来估计每个受试者的成员资格存在的主题治疗。受试者根据倾向性得分分为多个控制层/实验层。这将使各组在co方有相似特征的受试者之间保持平衡-变量。计算通过平均每个阶层因变量差异的总和来获得治疗效果。 我的问题是:为什么这比仅仅将接受治疗的受试者与接受类似非治疗的受试者进行匹配更好距离度量和协变量值?然后平均每对接受治疗和未接受治疗的受试者之间的差值之和?
这似乎更简单,似乎可以解决PSM旨在减少/消除的自我选择偏差。
我在这里遗漏了什么?
让我们退一步,更广泛地考虑如何匹配给定的一些数据X.
精确或单元格匹配
这对于连续的Xs很难做到。您可以尝试舍入/离散化每个变量,但这会引入一些测量误差。如果仍然选择继续,则可以与这些新变量交互以定义单元格。当X变大时,你会遇到维度的诅咒。如果有五个变量,每个变量有三个值,那么就有$3^5=243$cells。那么怎么办呢?
不精确匹配
不精确匹配过程通过在X上定义距离度量,然后使用距离而不是X进行匹配来降低问题的维数。马氏距离是一种常见的匹配方法。但是你可以有两个观察结果,这两个结果在MD中相当遥远,但治疗的可能性相同。在许多应用中,如果秃顶和胖乎乎都会增加寻求治疗的倾向,那么可以比较一个因为秃顶而可能接受治疗的受治疗者和一个因为胖乎乎而有类似概率的对照者。在PSM框架中,这会创建一个更大的匹配池。
随着样本的增大,所有不精确匹配方案都趋向于精确匹配(在X或倾向性得分上),因此所有不精确匹配方案都是一致的。然而,它们在有限样本中可以得到非常不同的答案,并且在有限样本中都有偏差。PSM可能不如寻找相似的人直观,但目标不是寻找相似的人。你所描述的程序不是倾向评分匹配,而是倾向评分子分类。在倾向得分匹配中,根据倾向得分之间的差异选择成对的单位,并删除未配对的单位。这两种方法都是在观察性研究中使用倾向得分来减少导致混淆偏差的不平衡的流行方法。
在倾向得分匹配中,两个单位之间的距离是他们倾向得分之间的差异,倾向得分是从协变量计算出来的,因此通过倾向得分匹配,您将基于距离度量和协变量值进行匹配。还有其他一些距离度量不涉及匹配中经常使用的倾向性得分,比如马氏距离。一些研究表明,作为一种距离度量,马氏距离比倾向得分差更有效,而一些研究表明并非如此。每种方法的相对性能取决于数据集的独特特性;对于哪种方法更好,没有办法提供一条始终正确的规则。两者都应该尝试。你也可以把倾向得分作为马氏距离的协变量包含进来。
如果你的问题更多的是为什么我们会在倾向得分匹配的时候做倾向得分子分类,那么有一些考虑因素。和以前一样,您应该始终使用在您的样本中产生最佳平衡的任何方法。倾向评分子分类可以更好地实现一些数据集的平衡和其他数据集的倾向评分匹配。没有理由单方面决定使用一种方法而不是另一种方法。子分类允许您估计ATT或ATE,而大多数匹配方法只允许ATT。子分类与倾向评分权重密切相关,当以某些方式使用时,而匹配通常不会为个体分配不均匀的权重。通过匹配,您可以更多地定制规范(例如,通过使用卡尺、通过更改控制与处理的比率等),而通过子分类,定制的机会更加有限。在完全匹配的情况下,匹配和子分类之间的区别是模糊的,完全匹配是两者的混合,通常表现得比两者都好。一些比较了这两种方法的性能,但是正如我之前提到的,不要依赖一般的结果,而是在示例中尝试这两种方法,这一点很重要。
请查看MatchIt R软件包的文档,其中详细介绍了几种匹配方法,并讨论了它们的一些相对优点和自定义方法。- End
免责声明:
本页内容仅代表作者本人意见,若因此产生任何纠纷由作者本人负责,概与琴岛网公司无关。本页内容仅供参考,请您根据自身实际情况谨慎操作。尤其涉及您或第三方利益等事项,请咨询专业人士处理。