匹配病例对照最常用的比例 最近能脱单吗塔罗-凯发注册

2023-12-2813880

1:2匹配设计多分类

匹配可分为群体匹配和个体匹配两类。
(1)群体匹配:群体匹配又叫成组匹配或频数匹配,即在选择对照组时,使所要求匹配的因素在所占比例上与病例组中的一致。如病例组中男女各半,65岁以上者占1/3,则对照人群也如此选择。
(2)个体匹配:以病例和对照的个体为单位进行匹配,叫做个体匹配。一比一匹配时称为配对。1:2、1:3、?、1:m比例的匹配,直接称为匹配,或称为配比。一个研究同时包含几种匹配形式时,叫混合匹配。其中最常用的是1:1的配对。

浅谈选择偏倚

病例对照中的rr与or

最开始学病例对照研究的时候可能有一个疑问,就是 为什么只能用比值比(or),而不能用风险比(rr) ,按道理直接算也是可以算出rr的。一般的解释是:在病例对照中,我们无法算出总体数量,也就是算risk时,没有固定的分母,或者分母是任意的。而这个分母取决于我们病例匹配的比例,比如当1:1匹配时,rr相对小,当1:100时,rr就会变大。

如图所示,一个假想的病例对照研究,其中假设我们对总体的发病情况已知:即图右侧的2×2表格,其中a、b、c、d分别代表相对应的个体数量。在病例对照的样本中(图左侧表格),我们假设从总体患病个体中随机抽取f1比例的样本,从总体非患病个体中随机抽取f2比例的样本,为了方便,我们同时假设不存在抽样误差。因此,样本中的个体可以表示为a=f1a,c=f1c,b=f2b,d=f2d。则我们可以计算rr的估计值为:

那么既然rr不行,我们再来看看or为什么可以。
                                                 病例对照中的选择偏倚

如因果图所示,a代表某种干预,y代表结果或某种疾病风险,c代表某个个体是否被选择进入病例对照研究样本中(1:不选择,0:选择)。可以想象,因为病例选择是任意的、人为的,所以病例会更多的或更少的选择进入样本中,表示为y对c的因果效应。而当干预a对选择人群中存在其他某种疾病风险的关联时,例如对某个疾病有保护作用,则当选择对照样本时,更容易选择有这个疾病的人群,表示为a对c的因果效应(或间接因果效应a-m-c)。

因此,当我们选取c=0的样本时,相当于校正了c变量,而c变量同时被a和y影响着,属于碰撞变量(collider),因此,引入选择偏倚,也称为不适当对照选取偏倚。

当然,除了上述描述以外,病例对照中还有其他情况的选择偏倚也可以用上述因果图或其修改版表示。

                                                  其他类型的选择偏倚

      无论在任何观察性研究中,我们通常有一个错误的校正偏倚策略,即校正全部收集到的协变量。这个校正方法有几个问题,简单的,从统计估计角度来讲,当协变量数量增加时,校正集会变成高维数据,产生维度诅咒现象或稀疏数据偏倚。当然,假设我们可以处理了高维度数据,那么,从识别角度来讲,也有可能引入选择偏倚。
      如上述因果图所示,l是干预a发生后所影响的一个变量,同时因为未知混杂变量u的存在,使得l与结果y之间产生相关性,此时l是一个碰撞变量。