贝叶斯概率
贝叶斯概率的核心问题是,如果我想知道条件A发生的时候,条件B发生的概率是多大。
有人会说这不就是简单的条件概率么?
条件概率
一个袋子里有 3 个红球和 2 个黄球。如果你已经摸出了一个红球(事件 B 发生),那么剩下球中再摸到红球(事件 A)的概率是多少?
这里
但是贝叶斯概率没这么简单,有时候我们不太好计算条件A发生的时候,条件B发生的概率。但是比较容易计算条件B发生的时候,条件A发生的概率。
比如,我们很容易计算得病的人试剂检测为阳性的概率。因为我们只需要在医院找到所以确诊的人测一遍就行了。
但是,我们求测试为阳性的人,得病的概率,就比较麻烦了。因为测试为阳性的人确诊是一个麻烦事,需要进一步检查。而且从可执行行角度也不太好操作,因为确认是一个比较花时间的过程,检测的人不一定愿意配合。
那是不是就不好计算了呢,不是的,有贝叶斯概率就好办。
这里我们假设得病为条件
那阳性得病的概率记为
由贝叶斯公式:
进一步丰富我们的例子,假设这个病的发病概率是
- 得病的人,且测试是阳性的概率是
- 没得病,且测试是阳性的概率是
假设,有
那么得病中检测是阳性的是
没得病中检测是阳性是
所以总阳性大概为
带入计算
也就是说检测为阳性并且得病的概率为
为什么有这样的结果
结果好像很让我们奇怪,为什么检测为阳性,但确诊的概率只有
这是因为大量的人其实健康的,如果我们直接计算的话,可以这么算:
- 得病中检测是阳性的是
- 没得病中检测是阳性是
在这
总结
所以贝叶斯概率可以让我们使用逆概率的概率去推导出一个不太好计算出的条件概率值。
在贝叶斯概率中,根据前面数据得出来的概率叫先验概率,比如这里的
为什么