《因果推断学习》学习笔记

《因果推断学习》学习笔记

前言:

今天看到师妹课上学到了因果推断这个知识点,关于这个点,我仅有的认知仍然是感性的,模糊的,单纯的几个概念:

  1. 相关性≠因果性
  2. 如果因为幸存者偏差,会导致错误归因。

每一点认知,我都会关联到一些具体的例子,比如《大数据时代》这本书中的经典案例:“尿布与啤酒”,每逢周末,某一连锁超市啤酒和尿布的销量都很大。这个具有相关性,但是这俩用pp想都没有啥因果,那么到底是导致的这个现象呢?原来是因为美国有孩子的家庭,妻子经常会让丈夫下班后给孩子买尿片,而丈夫买完尿片之后,自然顺手犒劳一下自己买点啤酒。

至于幸存者偏差,用老师ppt里的例子:

在这里插入图片描述
老师给的观点是:长得帅的人品又好的,早就被抢走了,剩下的长得帅的,人品好的概率就会比较低。

这样的逻辑分析,好像也有点道理,但是还不够量化,不够科学~

没有公式的东西,总归是不那么靠谱的。

虽然,我在老师的观点中,隐约看到了一点条件概率的影子。

为了以后在解析这个世界的时候,更加的靠谱,可以更加科学的找到,事物之间具体的因果关系,这个知识点必须要拿下!
好在知乎上搜到了一位大佬的帖子,三篇文章,一个小时带我开心弄懂基础概念。

学习链接:

因果推断学习1 — Simpson’s paradox
https://zhuanlan.zhihu.com/p/347183505
因果推断学习2 — 相关性!=因果性
https://zhuanlan.zhihu.com/p/347703807
因果推断学习3 — 随机试验
https://zhuanlan.zhihu.com/p/351283791

因果推断学习1 — Simpson’s paradox

最好直接看这三篇文章,写的非常通俗易懂!
大佬是把知识点掰碎了,把每一个字符的来历都讲明白了。

假设现在抵抗病毒COVID-27,有两种治疗Treatment T方案A和B,根据病情Condition C分为轻微mild和严重severe;最终我们观测结果outcome Y是否死亡,收集一部分数据分析可以发现

在这里插入图片描述
关于这个辛普森悖论,如果没点统计学知识,好像真的会被唬住。

疫情期间,我们也会在各种渠道上,看到各个药品的临床实验结果,那么到底该怎么评价对比每个治疗方案,这个例子实在是太有用了。

如果简单的用加权,我们发现在每个病情C {Mild, Severe}下,都是方案B死亡率更低{(10% vs. 15%),(20% vs. 30%)}。那在每种病情下,方案B都是更好的选择!但是汇总起来 {16% vs. 19%}(忽略病情条件,不同病情下数目汇总),方案A又是更好的,这就是Simpson’s paradox.

这明显透露出着不合理~

因果图的解析

在这里插入图片描述
这个鬼图第一眼让我看着很迷,但是大家看完了三篇文章之后,应该就能理解了。

其中T是我们的作用变量(effect),在上面的例子中就是不同的治疗方案,不同的治疗方案会对应着不同的治疗效果:
那么Y就是结果(outcome)。T–>Y的箭头大家能理解。
但是那个C是什么玩意儿?
在这里,C是混淆(confounding),这么描述就比较难理解了,好像把它当作是条件(condition)可能更好理解一些。但是在第三篇中具体的例子,可以看出来,C会导致T的产生,即C也可能是T,且C也可能会直接导致Y,即在上面的例子中,不同的病情,会导致不同的治疗方案,也会直接导致不同的治疗效果,即本身就是重症,那么死亡率自然会更高。

因果推断学习2 — 相关性!=因果性

这篇文章举了具体的几个例子,也蛮有意思的。

人的认知模式,总会有一些奇奇怪怪的归(mi)因(xin)现象。

比如前几天看到,之前福原爱每次打乒乓球都会给张继科带份小饼干,因为之前某次张继科吃了福原爱的小饼干后,夺冠了。

因果推断学习3 — 随机试验(最核心)

这篇文章点破了真正的因果关系。
如果有乱七八糟的C影响了T,该如何只评价T对Y的作用?那就消除C对Y的影响。
即切断C到Y的那个箭头。
但是T还是跟C有关,那么对T,只考虑C固定的情况,即也消除了C对T的因果的影响。

好起来了,基本上就能理解整个公式了。

最后,亲自手算一遍作者最后给的例子,新知识点 get !

总结:

对于这种相关性和因果性的关系,我们大脑的认知,是比较模糊的。

发生了好事儿,那么之前做的一系列事儿,都会觉得给自己带来了好运。

遇到了不幸,看谁都像是鬼东西。

但是理智告诉我们,这么稀里糊涂的过日子肯定不合理。

现在有了这套公式,也许可以帮助我们,更加快速的了解事物之间真正的因果,达到事半功倍的效果。

猜你喜欢

转载自blog.csdn.net/hehedadaq/article/details/121984934