R数据分析:孟德尔随机化中介的原理和实操

中介本身就是回归,基本上我看到的很多的调查性研究中在中介分析的方法部分都不会去提混杂,都是默认一个三角形画好,中介关系就算过去了,这里面默认的逻辑就是前两步回归中的混杂是一样的,计算中介效应的时候就自动消掉了。

但是,实际上对不对,还是有待具体分析的:

Traditional, non-instrumental variable methods for mediation analysis experience a number of methodological difficulties, including bias due to confounding between an exposure, mediator and outcome and measurement error

孟德尔随机化作为一个天然的免去混杂的方法,和中介结合,整个中介又变得更纯净了,是一种更加值得推崇的中介做法,也是孟德尔随机化研究的必要的延申。

今天给大家介绍孟德尔随机化中介分析的两个方法multivariable MR (MVMR) and two-step MR

先回顾中介作用

中介分析的基本的概念,就是大家熟悉的三角形:

c是总效应,加上中介变量后,A*B是间接效应,C'是直接效应,有总效应=间接效应+直接效应。

上图中如果总效应,直接效应和间接效应方向都相同的情况下,我们还可以报告中介效应比例,为间接效应比上总效应。

上面的图中的中介效应成立依赖几个假设:

首先就是没有混杂,包括变量之间没有混杂(或者像前面写的直接抵消);暴露不会造成额外混杂;暴露和中介变量没有交互。

再看孟德尔随机化的优势之一就是不受混杂影响,得到纯净的效应,所以将孟德尔随机化延伸一步去探究中介有天然优势。

MR approach retains the benefits of using genetic instruments for causal inference, such as avoiding bias due to confounding, while allowing for estimation of the different effects required for mediation analysis

multivariable MR

按照传统的回归中介的做法思想,我们如果可以跑多变量孟德尔,就可以做出中介分析的结果,具体就是两个暴露的孟德尔,一个是我们关心的暴露,另一个是中介。

MVMR estimates the “direct” causal effects of each exposure included in the estimation on the outcome, conditional on the other exposures included in the model.

跑多变量孟德尔后我们就可以得到中介模型中的直接效应:

就是说这样子跑下来我们就可以得到下图中的c'(直接效应)和B:

再加上我们单独跑一个暴露到结局的孟德尔,我们就有总效应了,利用总效应减去直接效应我们就可以得到间接效应(有了b,a也就出来了),整个中介分析就跑完了,这个就是多变量孟德尔跑中介分析的逻辑。

MR estimates the “total” effect of the exposure on the outcome, whereas MVMR estimates the “direct” effect of each exposure on the outcome

The genetic instrument for both the primary exposure and the second exposure (mediator) are included as instruments in the analysis . The indirect effect can then be estimated by subtracting the direct effect from the total effect (akin to the difference in coefficients method)

Two-step MR

此方法也可以用来计算中介,分为两步,第一步是计算暴露对中介变量的效应得到a,第二步是计算中介到结局的效应得到b,然后两系数相乘得到中介效应。

用总效应(单独跑一个暴露到结局的孟德尔,我们就有总效应了)减去中介效应后得到直接效应,到这儿所有的系数都有了。

The indirect effect of the exposure on the outcome can then be calculated by multiplying the effect of the exposure on the mediator and the effect of the mediator on the outcome. This is equivalent to the product of coefficients method of mediation analysis.

普通的回归肯定是不能这么做的(要得到系数B必须控制暴露),但是我们是跑的孟德尔,就意味着此时的我们跑出来的暴露到中介的效应A是纯净的,相应地B也是纯净的,所以我们才能这么跑。

两步孟德尔在跑的时候要注意,第二步使用的工具变量需要排除第一步就使用过的,因为合格的工具变量本身就不能重复,按理说两步的工具变量本身不应该存在重复,所以如果有重复在第二步的时候得排除掉。

First, genetic IVs associated with the risk factor are used to determine the causal effect of the risk factor on the potential mediator (step one). Secondly, genetic IVs associated with the potential mediator and independent of those used for step one are used to determine the effect of the potential mediator on the outcome of interest (step two)

上面两种方法都是孟德尔中介做法的思想,具体到操作上会有一些问题,比如用MVMR我们得到直接效应,用总效应减去直接效应我们其实只能得到间接效应的点估计,同样的,Two-step MR也存在这个问题,我们只能得到间接效应的点估计,怎么求标准误,和置信区间是在实操中要解决的问题。

下面给大家介绍几种解决方法。

猜你喜欢

转载自blog.csdn.net/tm_ggplot2/article/details/128960124