通俗易懂理解贝叶斯定理

贝叶斯概率定理是由英国数学家贝叶斯提出的,但在他生前这个理论一直不为人知,他去世后由他朋友整理书稿后才为世人所知。贝叶斯定理至今在人工智能、统计与概率等领域发挥着重要的作用。贝叶斯概率公式为下:
007.png
英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。而这篇论文是在他死后才由他的一位朋友发表出来的。
在这篇论文中,他为了解决一个“逆概率”问题,而提出了贝叶斯定理。

正概率与逆概率

在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”。什么是正向概率呢?举个例子,杜蕾斯举办了一个抽奖,抽奖桶里有10个球,其中2个白球,8个黑球,抽到白球就算你中奖。你伸手进去随便摸出1颗球,摸出是中奖球的概率是多大。
根据频率概率的计算公式,你可以轻松的知道中奖的概率=中奖球数(2个白球)/球总数(2个白球+8个黑球)=2/10
而贝叶斯在他的文章中是为了解决一个“逆概率”的问题。比如上面的例子我们并不知道抽奖桶里有什么,而是摸出一个球,通过观察这个球的颜色,来预测这个桶里里白色球和黑色球的比例。
这个预测其实就可以用贝叶斯定理来做。贝叶斯当时的论文只是对“逆概率”这个问题的求解尝试,这哥们当时并不清楚这里面这里面包含着的深刻思想。
然而后来,贝叶斯定理席卷了概率论,并将应用延伸到各个领域。可以说,所有需要作出概率预测的地方都可以见到贝叶斯定理的影子,特别地,贝叶斯是机器学习的核心方法之一。

如何使用贝叶斯定理解答简单的题目呢?

  1. 先求P(A),即抓取一个球,球来自A桶的概率,这叫做【先验概率】,也就是在没有约束条件(约束条件为抽取的是白球)下事件A发生的概率,这个很好计算为50%。
  2. 再求P(B|A)/P(B),这叫做【可能性函数】或【调整函数】,也就是在已知条件下抓取的是白球的情况下,对P(A)进行调整的因子。根据上文计算的P(B|A)= 75%,P(B)= 62.5%,得出调整因子为75%/62.5%=1.2。
  3. 最后求P(A|B),也被叫做【后验概率】= 【先验概率】 【调整函数】= P(A) (P(B|A)/P(B)) = 50% * 1.2 = 60% 。
    也就是说,抽取一个球,在信息不完整的情况下,这个球来自1号桶的概率为50%;在我们知道这个球是白球的条件下,那么这个球来自1号桶的可能性提高了20%(调整因子为1.2),则最终抽取的是白球且来自1号桶的概率将提升到60%。