贝叶斯算法是一种基于概率统计学的机器学习算法,其原理主要是利用贝叶斯定理进行分类。贝叶斯算法已经被广泛应用于文本分类、垃圾邮件过滤、新闻推荐和医疗诊断等领域。
贝叶斯算法的核心思想是基于贝叶斯定理:后验概率=先验概率×似然度/证据因子。在分类问题中,我们需要根据已知的特征值来预测一个样本所属于某个类别的概率。
具体来说,在使用贝叶斯算法进行分类时,首先需要建立一个训练集,该训练集由多个分类数据组成。在分类之前,需要提取每个分类数据的特征值,这些特征值可以包括文本中的单词、的像素值或者声音的频率等。然后,对于待分类的数据,需要计算其与每个分类数据的相似度,也就是计算其与每个训练集的类别的先验概率和各特征的条件概率的乘积。最终,将计算出的相似度与训练集中每个类别的先验概率进行比较,将待分类的数据归到概率最大的那个类别中,即为其分类结果。
贝叶斯算法的优点在于其可以通过引入领域、先验知识,对概率估计进行修正,从而提高分类的准确性。此外,贝叶斯算法采用了模型简单、易于实现等特性,在文本分类中得到了广泛应用。
然而,贝叶斯算法也存在着一定的缺点,例如:在训练集中所选取的特征值决定了贝叶斯分类器的性能,如果选择的特征值不完整或者存在大量的噪声,会导致分类效果较差;另外,贝叶斯算法假设各特征之间独立,但实际上很多情况下特征之间是存在关联的,这也会影响其分类性能。
总的来说,贝叶斯算法是一种基于统计学的机器学习算法,其原理是利用贝叶斯定理进行分类。虽然该算法在文本分类、垃圾邮件过滤、新闻推荐和医疗诊断等领域得到了广泛应用,但也需要针对具体情况进行合理地特征选择,并注意特征之间的关联关系,才能确保其在实际应用中具有较好的表现。
小李年方二八,身强力壮。参加单位组织的体检时,被检出 HIV 呈阳性。这惊雷轰得小李不省人事:自己明明生活检点,从没做过可能感染 HIV 的不良行为,这闹的是哪出啊!
假设整个人群感染 HIV 的概率是 008%。这家医院使用的检测方法对已经确诊携带 HIV 病毒的病人检测出阳性的概率是 99% (true positive rate),对没有携带 HIV 病毒的人检测呈阴性的概率是 99% (true negative rate)。聪明如你,帮小李算算他确实携带 HIV 病毒的概率是多少?
不着急,再想 5 分钟
答案是 734%。
一个简单而自然的算法是假设总共有 10000 人,由于 HIV 发病率是 008%,所以总共有 8 个人携带 HIV 病毒。由于没有携带 HIV 病毒的人检测呈阴性的概率是 99% ,所以这家医院使用的检测方法有 1% 的概率会导致没有携带 HIV 病毒的人被检测呈阳性,即 10000 人中总共会有 (10000 - 8) x 1% = 9992 人实际上没有携带 HIV 病毒,但检测出了阳性。针对己确诊患病的 8 人中,会有 8 x 99% = 792 人检测呈阳性。所以,小李携带 HIV 病毒的概率是 792 / (9992 + 792) = 734%。嗯,虽如晴天惊雷,但其实概率也没那么高嘛,特别是小李生活检点,不吸毒的前提下,误诊的概率极大。
wikipedia 上有个 专门的条目 讨论这种忽视基础概率问题的页面。
贝叶斯定理是关于条件概率的定理,其公式如下:
P(A|B) = P(A) P(B|A) / P(B)
解释一下公式:
我们用贝叶斯定理再算一下小李的患病概率,假设 A 表示携带 HIV 病毒事件,B 表示检测结果呈阳性事件,那么我们要求解的就是在检测结果呈阳性的情况下的真实患病概率,即 P(A|B)。P(A) 表示患病概率,在我们的例子里是 008%。P(B|A) 表示如果一个人己确诊患病,检测呈阳性的概率是多少,从例子里知道 P(B|A) = 99%。P(B) 表示随机一个人被检测呈阳性的概率是多少,这包括两部分的数据,一部分是患病且被检测呈阳性的概率,它的数值是 008% x 99%,另一部分没患病但被检测呈阳性的概率,它的数值是 (1 - 008%) x (1 - 99%)。根据贝叶斯定理:
P(A|B) = P(A) P(B|A) / P(B) = 008% x 99% / ((008% x 99%) + (1 - 008%) x (1 - 99%)) = 734%
看来和我们的土办法算出来的数值是相同的。
就象解读这个千疮百孔的世界一样,很多人选择把眼睛闭起来,选择对它视而不见。而一些人选择热爱这个千疮百孔的世界,努力前行,让这个世界变得美好一点点。
文艺地解读贝叶斯定理是可能的。P(A) 是基础概率,每个人刚来到这个世界上时,对这个世界的美好感受都有一个初始值,随着他的不断成长,碰到了事件 B ,而 B 刚好是这个世界美好的一面,比如一个学渣被女神鼓励,然后奋发图强,变成学霸,那么事件 B 的发生无疑会增加这个人对这个世界的美好程度的感知,所以 P(A|B) 增加了。身体发肤,受之父母。有些人的颜值就是比较高,高颜值的你如果是学渣的话,被女神鼓励的概率应该也是会比较高的,不知不觉,你的先天优势让 P(B|A) 更高。
这是对贝叶斯定理最文艺的解读,没有之一。
然并卵。除了看完感觉有道理之外,你还是不理解贝叶斯定理定理的本质。一个事物的本质往往是朴素的,朴素到没有女神,颜值也处在正态分布的正中间。
维基百科上的这张图包含了简易的推导贝叶斯定理的过程,简洁,朴素。
而从事件发生频率角度解读贝叶斯定理的的另外一张,让我们和贝叶斯走得更近。
学点概率,用更朴素的视角去看世界。
看了贝叶斯定理,大多数文章都一步步解释贝叶斯公式,用抽象的实例如计算发病率,计算吸毒率甚至计算渣女的概率解释这个伟大的公式,又为此搞出一堆“先验率”、“后验率”等抽象的词汇解释公式内涵。一个命题还没有说清楚又搞出一些新词汇、新概念反而污染了公式本身的纯粹性和朴实性。
我们试图想象贝叶斯是怎么想出这个定理?都是人类为什么他能想出来,他的思维逻辑怎么形成的,这个问题说明白了对人类从事工作有着重要意义。而不是死记别人公式,用一个个概念骗人,冠冕堂皇的说成“术语”。
假设有A集合,B集合,A和B有交集,A+B是全集,这就是贝叶斯所知道的已知条件。贝叶斯喜欢琢磨,琢磨什么呢?就是A和B都是概率,A∩B这个概率怎么表示,因为当一些人琢磨八股文用毕生精力搏取功名的时候,贝叶斯的追求是怎么用公式表达自然界,越简单越好,至于之后能用到哪里不是他关心的事。。。。
因为A与B有交集,那么B在A里占比多少?A在B里占比多少?先不管他是不是概率,Thomas Bayes给出了第一个抽象表示,即
A∩B/B,交集在B里的占比,反之A∩B/A是交集在A里的占比,再简化表示一下,
A|B=A∩B/B (1)交集在B里占比
B|A=A∩B/A (2)交集在A里的占比
公式(1)和(2)里有公用项,Thomas Bayes毫不犹豫的抵消公用项以简化公式,即
A|B/(B|A)=A/B
如以上A,B代指不同事件的概率,即
P(A|B)=P(A)P(B|A)/P(B) (3)
公式(3)就是大名鼎鼎的贝叶斯定理公式,这个公式在其死后被发现,对条件概率有巨大贡献。
也就是说
P(A),P(B)分别代表两个不同事件的发生概率,贝爷想知道,B事件发生时,A发生的概率P(A|B),该概率等同于P(A)和一个因子结合,这个因子就是P(B|A)/P(B),也就是说,A事件发生时,B发生的概率与P(B)的比。
进一步说,
想计算B事件发生时,A发生的概率可以理解成A本身的概率受一个因子干扰,这个因子可能放大A本身的概率,也可能降低A本身的概率,如果A发生时,B发生概率越大,P(A|B)越大,成正比,反之,P(B)越大,P(A|B)越小,成反比。
所以,女孩去夜店次数越多,是渣女的概率就越大,P(渣女|夜店)=P(渣女) P(夜店|渣女)/ P(夜店), 关键因子P(夜店|渣女),渣女多出现在夜店这个事实增强了夜店里的女孩是渣女的概率。
那么可以用简短的一句话概括贝爷的定理:
P(A|B)与P(B|A)成正比,与P(B)成反比。
贝叶斯定理(Bayes' theorem)是概率论中的一个结论,它跟随机变量的条件概率以及边缘概率分布有关。在有些关于概率的解说中,贝叶斯定理(贝叶斯更新)能够告知我们如何利用新证据修改已有的看法。通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定理就是这种关系的陈述。
贝叶斯定理可以理解成下面的式子:
后验概率(新信息出现后A发生的概率)=先验概率(A发生的概率)x可能性函数(新信息带出现来的调整)贝叶斯的底层思想就是:
如果我能掌握一个事情的全部信息,我当然能计算出一个客观概率(古典概率、正向概率)。
可是生活中绝大多数决策面临的信息都是不全的,我们手中只有有限的信息。既然无法得到全面的信息,我们就在信息有限的情况下,尽可能做出一个好的预测。也就是,在主观判断的基础上,可以先估计一个值(先验概率),然后根据观察的新信息不断修正(可能性函数)。
贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分。 贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。 贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想是: 1、已知类条件概率密度参数表达式和先验概率。 2、利用贝叶斯公式转换成后验概率。 3、根据后验概率大小进行决策分类。 他对统计推理的主要贡献是使用了"逆概率"这个概念,并把它作为一种普遍的推理方法提出来。贝叶斯定理原本是概率论中的一个定理,这一定理可用一个数学公式来表达,这个公式就是著名的贝叶斯公式。 贝叶斯公式是他在1763年提出来的: 假定B1,B2,……是某个过程的若干可能的前提,则P(Bi)是人们事先对各前提条件出现可能性大小的估计,称之为先验概率。如果这个过程得到了一个结果A,那么贝叶斯公式提供了我们根据A的出现而对前提条件做出新评价的方法。P(Bi∣A)既是对以A为前提下Bi的出现概率的重新认识,称 P(Bi∣A)为后验概率。经过多年的发展与完善,贝叶斯公式以及由此发展起来的一整套理论与方法,已经成为概率统计中的一个冠以“贝叶斯”名字的学派,在自然科学及国民经济的许多领域中有着广泛应用。公式: 设D1,D2,……,Dn为样本空间S的一个划分,如果以P(Di)表示事件Di发生的概率,且P(Di)>0(i=1,2,…,n)。对于任一事件x,P(x)>0,则有: n P(Dj/x)=p(x/Dj)P(Dj)/∑P(X/Di)P(Di) i=1 ( http://wikimbalibcom/w/images/math/9/9/b/99b1873c5d047747a8768a99ac7c370epng)贝叶斯预测模型在矿物含量预测中的应用 贝叶斯预测模型在气温变化预测中的应用 贝叶斯学习原理及其在预测未来地震危险中的应用 基于稀疏贝叶斯分类器的汽车车型识别 信号估计中的贝叶斯方法及应用 贝叶斯神经网络在生物序列分析中的应用 基于贝叶斯网络的海上目标识别 贝叶斯原理在发动机标定中的应用 贝叶斯法在继电器可靠性评估中的应用 相关书籍: Arnold Zellner 《Bayesian Econometrics: Past, Present and Future》 Springer 《贝叶斯决策》 黄晓榕 《经济信息价格评估以及贝叶斯方法的应用》 张丽 , 闫善文 , 刘亚东 《全概率公式与贝叶斯公式的应用及推广》 周丽琴 《贝叶斯均衡的应用》 王辉 , 张剑飞 , 王双成 《基于预测能力的贝叶斯网络结构学习》 张旭东 , 陈锋 , 高隽 , 方廷健 《稀疏贝叶斯及其在时间序列预测中的应用》 邹林全 《贝叶斯方法在会计决策中的应用》 周丽华 《市场预测中的贝叶斯公式应用》 夏敏轶 , 张焱 《贝叶斯公式在风险决策中的应用》 臧玉卫 , 王萍 , 吴育华 《贝叶斯网络在股指期货风险预警中的应用》 党佳瑞 , 胡杉杉 , 蓝伯雄 《基于贝叶斯决策方法的证券历史数据有效性分析》 肖玉山 , 王海东 《无偏预测理论在经验贝叶斯分析中的应用》 严惠云 , 师义民 《Linex损失下股票投资的贝叶斯预测》 卜祥志 , 王绍绵 , 陈文斌 , 余贻鑫 , 岳顺民 《贝叶斯拍卖定价方法在配电市场定价中的应用》 刘嘉焜 , 范贻昌 , 刘波 《分整模型在商品价格预测中的应用》 《Bayes方法在经营决策中的应用》 《决策有用性的信息观》 《统计预测和决策课件》 《贝叶斯经济时间序列预测模型及其应用研究》 《贝叶斯统计推断》 《决策分析理论与实务》
读过万维钢的《智识分子》关于贝叶斯定理一节后,略有启发,就自己整理了一下。
贝叶斯公式如下:
这个公式有什么用呢?
它可以把你”相信或者不相信一件事“用概率的形式量化起来。
你相信中医吗?你相信上帝吗?
大多数人会以简单的”相信“或者”不相信“来回答。
而理性的人士,尤其是数学家喜欢用概率来描述,他可能会说:中医有用的概率有30%,上帝存在的概率有50%。
这个数字是怎么由来呢?信念应该如何量化呢?贝叶斯共识就派上了用场。
公式详解:
A:代表事件,如:中医有用。
P(A)表示A事件的概率。
B:代表一个与之有关的事件,如:我朋友去看了中医,结果病好了。
P(B)表示B事件的概率。
P(A|B)代表B发生的情况下,A发生的概率。
P(B|A)代表A发生的情况下,B发生的概率。
以中医为例:
P(A)好理解,我个人事先认为中医有用的概率为30%,即P(A)=30%
那P(B)怎么理解呢?
P(B)代表着朋友甲通过中医看病,看好的概率。
那P(B)的概率怎么算呢?
我们把P(B)拆分一下:
P(B)=P(B|A)P(A) + P(B|A') P(A‘)
其中A‘代表A的相反事件,即中医没用。P(A)+P(A’)=1
即朋友甲通过中医看病能看好的概率=中医真心有用的情况下病能好的概率+中医就是没用的情况下病能好的概率。
如果中医就是没用,朋友看不看中医,病都有可能好,我们可以认为他病好的可能性有50%,即P(B|A’)=50%
如果中医真心有用,朋友的病在中医的加持下,很容易好,那我们就估算它P(B|A)=80%。
可以得出:
P(B)=P(B|A)P(A) + P(B|A') P(A‘)=80%x30%+50%x70%=059
那么:
P(A|B)=P(B|A)P(A)/P(B)=(80%x30%)/059=41%
这意味着什么呢
我原本对中医的信念仅仅只有:30%
通过最近我一朋友得病,久治不得医,但因为去了看中医,居然病好了,于是,我对中医的信念直接提高到了41%!
总结:
1、贝叶斯定理讲的是主观概率,需要主观地带入各个参数。
2、主观概率不一定严谨,但就是很有用。用概率量化个人的信念,更有助于理性决策。
3、有用是因为生活中我们面临的信息往往是不全的,我们对一件事的信念低,大多是因为证据不足,如果获得了新的证据,即可实时调整自己对这件事新的看法。
4、理性的人应该有一套复杂的信念体系,随时调整自己对各种事物的看法,不固执己见,不断变动自己的世界观。
5、若是有新事件进来,比如又一朋友乙久病不得治,后看中医最终身亡,可能我对中医的信念根据贝叶斯公式将降至10%。
6、观点随事实而变,是有胆识的表现。
中医举例或许不当,请担待。
欢迎分享,转载请注明来源:表白网
评论列表(0条)