文艺地解读贝叶斯定理

文艺地解读贝叶斯定理,第1张

小李年方二八,身强力壮。参加单位组织的体检时,被检出 HIV 呈阳性。这惊雷轰得小李不省人事:自己明明生活检点,从没做过可能感染 HIV 的不良行为,这闹的是哪出啊!

假设整个人群感染 HIV 的概率是 008%。这家医院使用的检测方法对已经确诊携带 HIV 病毒的病人检测出阳性的概率是 99% (true positive rate),对没有携带 HIV 病毒的人检测呈阴性的概率是 99% (true negative rate)。聪明如你,帮小李算算他确实携带 HIV 病毒的概率是多少?

不着急,再想 5 分钟

答案是 734%。

一个简单而自然的算法是假设总共有 10000 人,由于 HIV 发病率是 008%,所以总共有 8 个人携带 HIV 病毒。由于没有携带 HIV 病毒的人检测呈阴性的概率是 99% ,所以这家医院使用的检测方法有 1% 的概率会导致没有携带 HIV 病毒的人被检测呈阳性,即 10000 人中总共会有 (10000 - 8) x 1% = 9992 人实际上没有携带 HIV 病毒,但检测出了阳性。针对己确诊患病的 8 人中,会有 8 x 99% = 792 人检测呈阳性。所以,小李携带 HIV 病毒的概率是 792 / (9992 + 792) = 734%。嗯,虽如晴天惊雷,但其实概率也没那么高嘛,特别是小李生活检点,不吸毒的前提下,误诊的概率极大。

wikipedia 上有个 专门的条目 讨论这种忽视基础概率问题的页面。

贝叶斯定理是关于条件概率的定理,其公式如下:

P(A|B) = P(A) P(B|A) / P(B)

解释一下公式:

我们用贝叶斯定理再算一下小李的患病概率,假设 A 表示携带 HIV 病毒事件,B 表示检测结果呈阳性事件,那么我们要求解的就是在检测结果呈阳性的情况下的真实患病概率,即 P(A|B)。P(A) 表示患病概率,在我们的例子里是 008%。P(B|A) 表示如果一个人己确诊患病,检测呈阳性的概率是多少,从例子里知道 P(B|A) = 99%。P(B) 表示随机一个人被检测呈阳性的概率是多少,这包括两部分的数据,一部分是患病且被检测呈阳性的概率,它的数值是 008% x 99%,另一部分没患病但被检测呈阳性的概率,它的数值是 (1 - 008%) x (1 - 99%)。根据贝叶斯定理:

P(A|B) = P(A) P(B|A) / P(B) = 008% x 99% / ((008% x 99%) + (1 - 008%) x (1 - 99%)) = 734%

看来和我们的土办法算出来的数值是相同的。

就象解读这个千疮百孔的世界一样,很多人选择把眼睛闭起来,选择对它视而不见。而一些人选择热爱这个千疮百孔的世界,努力前行,让这个世界变得美好一点点。

文艺地解读贝叶斯定理是可能的。P(A) 是基础概率,每个人刚来到这个世界上时,对这个世界的美好感受都有一个初始值,随着他的不断成长,碰到了事件 B ,而 B 刚好是这个世界美好的一面,比如一个学渣被女神鼓励,然后奋发图强,变成学霸,那么事件 B 的发生无疑会增加这个人对这个世界的美好程度的感知,所以 P(A|B) 增加了。身体发肤,受之父母。有些人的颜值就是比较高,高颜值的你如果是学渣的话,被女神鼓励的概率应该也是会比较高的,不知不觉,你的先天优势让 P(B|A) 更高。

这是对贝叶斯定理最文艺的解读,没有之一。

然并卵。除了看完感觉有道理之外,你还是不理解贝叶斯定理定理的本质。一个事物的本质往往是朴素的,朴素到没有女神,颜值也处在正态分布的正中间。

维基百科上的这张图包含了简易的推导贝叶斯定理的过程,简洁,朴素。

而从事件发生频率角度解读贝叶斯定理的的另外一张,让我们和贝叶斯走得更近。

学点概率,用更朴素的视角去看世界。

贝叶斯算法是一种基于概率统计学的机器学习算法,其原理主要是利用贝叶斯定理进行分类。贝叶斯算法已经被广泛应用于文本分类、垃圾邮件过滤、新闻推荐和医疗诊断等领域。

贝叶斯算法的核心思想是基于贝叶斯定理:后验概率=先验概率×似然度/证据因子。在分类问题中,我们需要根据已知的特征值来预测一个样本所属于某个类别的概率。

具体来说,在使用贝叶斯算法进行分类时,首先需要建立一个训练集,该训练集由多个分类数据组成。在分类之前,需要提取每个分类数据的特征值,这些特征值可以包括文本中的单词、的像素值或者声音的频率等。然后,对于待分类的数据,需要计算其与每个分类数据的相似度,也就是计算其与每个训练集的类别的先验概率和各特征的条件概率的乘积。最终,将计算出的相似度与训练集中每个类别的先验概率进行比较,将待分类的数据归到概率最大的那个类别中,即为其分类结果。

贝叶斯算法的优点在于其可以通过引入领域、先验知识,对概率估计进行修正,从而提高分类的准确性。此外,贝叶斯算法采用了模型简单、易于实现等特性,在文本分类中得到了广泛应用。

然而,贝叶斯算法也存在着一定的缺点,例如:在训练集中所选取的特征值决定了贝叶斯分类器的性能,如果选择的特征值不完整或者存在大量的噪声,会导致分类效果较差;另外,贝叶斯算法假设各特征之间独立,但实际上很多情况下特征之间是存在关联的,这也会影响其分类性能。

总的来说,贝叶斯算法是一种基于统计学的机器学习算法,其原理是利用贝叶斯定理进行分类。虽然该算法在文本分类、垃圾邮件过滤、新闻推荐和医疗诊断等领域得到了广泛应用,但也需要针对具体情况进行合理地特征选择,并注意特征之间的关联关系,才能确保其在实际应用中具有较好的表现。

看了贝叶斯定理,大多数文章都一步步解释贝叶斯公式,用抽象的实例如计算发病率,计算吸毒率甚至计算渣女的概率解释这个伟大的公式,又为此搞出一堆“先验率”、“后验率”等抽象的词汇解释公式内涵。一个命题还没有说清楚又搞出一些新词汇、新概念反而污染了公式本身的纯粹性和朴实性。

我们试图想象贝叶斯是怎么想出这个定理?都是人类为什么他能想出来,他的思维逻辑怎么形成的,这个问题说明白了对人类从事工作有着重要意义。而不是死记别人公式,用一个个概念骗人,冠冕堂皇的说成“术语”。

假设有A集合,B集合,A和B有交集,A+B是全集,这就是贝叶斯所知道的已知条件。贝叶斯喜欢琢磨,琢磨什么呢?就是A和B都是概率,A∩B这个概率怎么表示,因为当一些人琢磨八股文用毕生精力搏取功名的时候,贝叶斯的追求是怎么用公式表达自然界,越简单越好,至于之后能用到哪里不是他关心的事。。。。

因为A与B有交集,那么B在A里占比多少?A在B里占比多少?先不管他是不是概率,Thomas Bayes给出了第一个抽象表示,即

A∩B/B,交集在B里的占比,反之A∩B/A是交集在A里的占比,再简化表示一下,

A|B=A∩B/B  (1)交集在B里占比

B|A=A∩B/A (2)交集在A里的占比

公式(1)和(2)里有公用项,Thomas Bayes毫不犹豫的抵消公用项以简化公式,即

A|B/(B|A)=A/B   

如以上A,B代指不同事件的概率,即

P(A|B)=P(A)P(B|A)/P(B) (3)

公式(3)就是大名鼎鼎的贝叶斯定理公式,这个公式在其死后被发现,对条件概率有巨大贡献。

也就是说

P(A),P(B)分别代表两个不同事件的发生概率,贝爷想知道,B事件发生时,A发生的概率P(A|B),该概率等同于P(A)和一个因子结合,这个因子就是P(B|A)/P(B),也就是说,A事件发生时,B发生的概率与P(B)的比。

进一步说,

想计算B事件发生时,A发生的概率可以理解成A本身的概率受一个因子干扰,这个因子可能放大A本身的概率,也可能降低A本身的概率,如果A发生时,B发生概率越大,P(A|B)越大,成正比,反之,P(B)越大,P(A|B)越小,成反比。

所以,女孩去夜店次数越多,是渣女的概率就越大,P(渣女|夜店)=P(渣女) P(夜店|渣女)/ P(夜店), 关键因子P(夜店|渣女),渣女多出现在夜店这个事实增强了夜店里的女孩是渣女的概率。

那么可以用简短的一句话概括贝爷的定理:

P(A|B)与P(B|A)成正比,与P(B)成反比。

欢迎分享,转载请注明来源:表白网

原文地址:https://h5.hunlipic.com/biaobai/3154985.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2024-02-09
下一篇2024-02-09

发表评论

登录后才能评论

评论列表(0条)

    保存