博弈论沉思11贝叶斯纳什均衡

博弈论沉思11贝叶斯纳什均衡,第1张

53不完全信息静态博弈——贝叶斯纳什均衡

在不完全信息静态博弈中, 所有参与人同时行动,其战略空间等于行动空间 ,但是 参与人 i 的行动空间可能依赖于其类型,也就是行动空间是类型依存的。 类似的, 其支付函数也是类型依存的。 如企业能选择什么产量依赖于它的成本函数,一个人能干什么依赖于它的能力等。

在市场进入的例子里,均衡战略是:高成本的在位者选择默许,低成本的在位者选择斗争。只有当高成本的概率p=1/5时,进入者才选择进入,否则不进入。

54 如何甄别信息的真伪

所罗门王是犹太民族历史上最伟大的君王,也是世界上最传奇的君王之一。

妇女甲陈述未完,妇女乙就激动地向所罗门抗辩道:“不,她说的是假话!死去的才是她的儿子,她自己不小心,晚上睡觉时把自己的孩子压死了,现在想把我的儿子抢走。”

而妇女甲更加激动,大声地说:“活着的是我的儿子!我的儿子……”

二女争子,吵得不可开交。这件奇案一时间也难住了所罗门。

在所罗门的那个时代,医学上还未发展到验血认亲、DNA亲子鉴定的地步。本案又丝毫没有其他的人证、物证可供参考。所罗门沉思良久,突然睁开眼睛,发出一个简短的命令:“拿剑来”。

此时,真相大白。按人之常情,只有亲生母亲才会委屈自己,以保存孩子的性命,于是,所罗门作出了一个千古传诵的判决:“把孩子交给妇女甲,她才是真正的生母”。而狠毒的妇女乙,则受到了法律应有的惩罚。

这个英明的判决在世界各地流传了将近3000年,使所罗门成为了西方世界妇孺皆知的一个司法正义的守护神。当然,如果用现代法治的原理和观点来看,所罗门这一司法行为显然是大有问题的。他首先是触犯了法律,即违反了法律中“不可妄杀人”这一条;其次,他的恐吓之所以能产生这样大的戏剧性效果,则全因为妇女甲乙以及全体子民都知道,他手上确实有“切开婴儿”而无须经任何司法程序批准的权力。

这种“法治”,其实还是一种“权力至上”的“人治”,充其量,它只是一种“形式法治”。

但在那个遥远的古代,在那种完全没有事实证据的情况下,作为一个能积极创造条件、克服困难、去实现司法公正的审判官,所罗门的智慧,确实是值得千秋万世的景仰。

55 将计就计

纳什均衡Nash equilibrium,又称为非合作博弈均衡,是博弈论的一个重要术语,使得每个参与人的策略是对其他参与人策略的最优反应,是以约翰·纳什命名的。

纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。

假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

子博弈完美纳什均衡是适合动态博弈的新的均衡概念:不包含任何不可信的威胁或许诺(即在每个子博弈上都是纳什均衡)它是纳什均衡,具有策略稳定性。如果一个完美信息的动态博弈的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么称该策略组合为该动态博弈的一个“子博弈完美纳什均衡”。

Nash均衡、子博弈精炼的Nash均衡、贝叶斯Nash均衡、贝叶斯精炼Nash均衡。

Nash均衡是完全信息静态博弈的解;

子博弈精炼的Nash均衡是完全且完美信息动态博弈的解;

贝叶斯Nash均衡是不完全信息静态博弈及完全且不完美信息动态博弈的解;

贝叶斯精炼Nash均衡是不完全信息动态博弈的解。

不是所有博弈都存在纳什均衡 如纯策略就不存在

混合策略则一定会存在纳什均衡 它是通过概率来计算纳什均衡

在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。

当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。

扩展资料;

纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。

要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。

所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。

混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。

当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。

因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。

然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。

参考资料来源;——纳什平衡

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义,它是研究互动决策的理论,即各行动方的决策是相互影响。——搜狗百科

纳什均衡又称为非合作博弈均衡,是在给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合。——搜狗百科

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。——搜狗百科

智猪博弈问题:假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是什么?

小猪绝对不会按按钮

因为小猪只要按下按钮 大猪就会先吃到食物

小猪只有2种收益情况

一 p=-1(大猪不按)

二 p=1(大猪按)

如果小猪不按按钮那么收益情况也是两种

一 p=0(大猪不按)

二 p=4(大猪按)

因此可以看出大猪不管做哪种决定

小猪只要按下按钮 它就意味着肯定吃亏

因此小猪肯定不会按

那么大猪也会分析在小猪不按按钮的情况下自己的收益

大猪不按 收益p=0

大猪按 收益p=4

此时大猪发现如果自己按收益会高一些

毕竟有收益好过没有收益

因此大猪决定会按下按钮 ——

故在大小猪都聪明的情况下

两只猪的收益都是4

并且此时的策略集为大猪按键,小猪等待

欢迎分享,转载请注明来源:表白网

原文地址:https://h5.hunlipic.com/biaobai/2821654.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2024-01-14
下一篇2024-01-14

发表评论

登录后才能评论

评论列表(0条)

    保存