相关性≠因果性与选择性数据

📖 第三章·第三节 原因 📝 约850字 🏷️ 5 标签
💡 核心观点

相关性不等于因果关系,单向度的数据分析和缺乏适当参照物会导致错误的因果推断,必须同时考虑正反两方面证据。

📖 原文精要

我们倾向于认为两件事相继发生后,前者是因、后者是果。但一个变量的变化与另一个变量变化紧密相关并不代表一方引起另一方,第三方因素可能是原因。金钱和幸福之间有高度相关性,但并不清楚是金钱带来了幸福,还是幸福创造了财富,或者第三方因素导致两者。

28名玩"龙与地下城"的青少年自杀身亡,媒体认为游戏导致了自杀。但美国数学家保罗士指出:该游戏有约300万青少年玩家,该年龄段每年自杀率为12/100,000,意味着平均每年应有360人自杀——28人并未超过预期。

多重解释:玛丽发烧可能是感冒,也可能是其他疾病。发烧的迹象在许多疾病中都可以发现。应问:还有其他可以解释这个结果的原因吗?

选择性数据和适当参照物至关重要。伏尔泰被说"生活太艰难了"时反驳:"与什么对比?"研究成功企业发现"专注"是成功诀窍,但许多失败企业同样专注。为理解成功品质,需要对比成功和失败的企业。幸存者偏差:通过采访空难幸存者得出求生技巧,但无法采访遇难者——也许遇难者做了同样的事。

统计学家瓦尔德研究飞机装甲时建议加强没有弹孔的机体部位——因为他考虑了未能返航的飞机。在显要部位中弹的飞机仍能返回,说明被击中的是非显要部位才致命。评价治疗效果时,必须对比未接受治疗组的结果——许多患者即使无实质帮助也能自愈,所以没有价值的治疗看起来也很有效。

🏷️ 核心标签
误判数学 相关性≠因果性 选择性数据 幸存者偏差 参照物