博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
案例一:囚徒困境
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表22中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。
单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的决策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。
而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,想更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。
案例二:智猪博弈
一、经济学中的“智猪博弈”(Pigs’payoffs) 这个例子讲的是:
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是6∶4;同时到槽边,大小猪收益比是7∶3;小猪先到槽边,大小猪收益比是9∶1。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
"智猪博弈"由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:
从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗?
案例三:美女的硬币
一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗?
假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)(1-x)=(-2)x+1(1-x)。这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3x+(-2)(1-x)中就可得到每次的期望收入,计算结果是-1/8元。
同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)(1-y)。解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元
如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。看起来这个博弈模型似乎没有什么用处,但是其实这可能牵涉了金融市场定价中最重要的一个模型:定价权重模型了。
总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来,并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作。
资料来源:博弈论
案例四:普通范式博弈
GOO公司和SAM公司是某手机产品生态的两大重量级参与者,双方在产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心。二者的收益也随着博弈的变化而不断更替。
上图表格模拟了两家公司的博弈现状,双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益),每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。博弈是同时进行的,一方参与者必须站在对方的角度上来思考我方的策略选择,以追求收益最大化。这在博弈论里称作Putting yourselves into other people's shoes。
现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。假如SAM公司选择合作,那么我方也选择合作带来的收益是3,而我方选择背叛带来的收益是5,基于理性的收益最大化考虑,我方应该选择背叛,这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是-3,而选择背叛带来的收益为-1,为使损失降到最低,我方应该选择背叛。最后,GOO公司的分析结果是,无论SAM公司选择合作还是背叛策略,我方都必须选择背叛策略才能获得最大化的收益。同理,当SAM公司也以严格优势策略来应对GOO公司的策略选择时,我们重复上述分析过程,就能得出结论:无论GOO公司选择合作还是背叛策略,SAM公司都必须选择背叛策略才能获得最大化收益。
最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。这种局面就是著名的“囚徒困境”。但是,博弈的次数往往不止一次,就像COO与SAM公司双方的商业往来也许会有很多机会。当二者经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这比(-1,-1)的收益结果显然要好很多,因此二者在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。
这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。随着次数(博弈性质)的变化,纳什均衡点也并非唯一。
案例五:饿狮博弈
题设为A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。细心的人也许会发现,假如增加或减少狮子的总数,博弈的结果会完全不同。
我们在狮子F的后面增加了一只狮子G,总数变成7只。用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
通过上述案例的多轮博弈,初学者应该能够隐约发现纳什均衡的轮廓。当博弈次数不止一次地进行着时,博弈结果将重复定格在某个状态,那个状态即是纳什均衡点。公理解释是如果博弈在某情况下无任一参与者可以通过独自行动而增加收益,则此时的策略组合被称为纳什均衡。
简单的博弈案例看上去似乎有趣,但博弈论始终是一门深奥复杂的学问,它的复杂之处就在于博弈分析所用的理想化模型与现实永远存在差异。比如博弈论要求各方参与者必须是经济学意义上的“理性人”,而事实上完全的“理性人”并不存在。现实世界存在着太多超出博弈论的变数,这为追求精确预测的博弈模型构建工作带来难度。
尽管如此,博弈论仍然改变了世界,成为人类理性认识世界的一个重要工具。而纳什均衡的提出无疑丰富了博弈论的理论体系,它是人类文明的一片砖瓦。可以肯定的是,百年之后,人们依然不会忘记约翰•纳什的名字,亦不会忘记那个神奇的纳什均衡。资料来源:两个经典例子,揭开博弈论以及纳什均衡的神秘面纱,本文系作者 水哥
通过主观意识借助实体或者虚拟表现、构成客观阐述形态、结构的一种表达目的的物件(物件并不等于物体,不局限于实体与虚拟、不限于平面与立体)。
模型构成形式可分为实体模型(拥有体积及重量的物理形态概念实体物件)及虚拟模型(用电子数据通过数字表现形式构成的形体以及其他实效性表现)。
模型展示形式分为平面展示和立体展示(标识是平面展示的一种例如图册示例图)。
实体模型从表现形式可分为静模(物理相对静态,本身不具有能量转换的动力系统,不在外部作用力下表现结构及形体构成的完整性)、助力模型(以静模为基础,可借助外界动能的作用,不改变自身表现结构,通过物理运动检测的一种物件结构连接关系)以及动模(可通过能量转换方式产生动能,在自身结构中具有动力转换系统,在能量转换过程中可表现出的相对连续物理运动形式)。
博弈本意是:下棋。引申义是:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。有时候也用作动词,特指选择的行为或策略进行选择并加以实施的过程。
一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
首先应考虑动态博弈模型,要三方有先后的行动顺序;其次,加上各方的行动策略;再次,加上对应的效用或得益(payoff,现多译为“支付”);最后进行基于得益或支付的均衡分析。
博弈本意是:下棋。引申义是:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。时候也用作动词,特指选择的行为或策略进行选择并加以实施的过程。
据我的不完全统计,你的描述当中有8次提到初恋,有4次提到现在的女友。可以说,初恋在你心中的地位远远超过的现任女友,可能只要你的初恋现在如果只要主动一点对你有所表示的话,你就会马上投入她的怀抱(额,姑且先这么说,我还没找到合适的词)。
还有如果你现在还像以前那么潇洒倜傥的话,也肯定会
我说这话并没有要讽刺或是批判你的意思啊!每个人都有他的劣根性,你也不例外。任何人都会有要去追求自己认为最好的东西欲望。
呵呵!不过,幸亏我佛慈悲啊,用90公斤的体重把你这匹马从悬崖边勒了回来,让你能有所顾忌。
正所谓色即是空,空即是色。珍惜眼前的,把握现在的才是真理啊!
回忆之所以美好,那是因为它叫做回忆啊;不美好的我们会把它叫做往事,往事不堪回首嘛!所以大部分时间人们都只会记得过去的美好!
博弈论(Game Theory)是 研究具有斗争或竞争性质现象的数学理论和方法,二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的[1] 。
1928年,著名科学家、计算机之父冯·诺依曼证明了博弈论定理。
1950年,普林斯顿数学系教授约翰·纳什,通过不动点原理证明了均衡点的存在,并且提出了著名的纳什均衡理论,将博弈论引入到了除数学以外的其它领域内。
1994年,约翰·纳什与约翰·海萨尼、莱茵哈德·泽尔滕,处于表彰他们对博弈论做出的贡献,授予三位当年的诺贝尔经济学奖,从此博弈论被推上了学术界高峰地位。2001年一部以约翰·纳什为传记改编的**《美丽心灵》,诠释了纳什的传奇人生。
2001年,乔治·阿科尔洛夫、斯宾塞和约瑟夫·斯蒂格利茨,利用博弈论分析了市场的信息不对称问题,为现代信息经济学奠定了基础。
2005年,托马斯·克罗姆比·谢林和罗伯特·约翰·奥曼通过博弈论分析了冲突和合作的理解。
2007年,罗杰·迈尔森和埃里克·马斯金、里奥尼德·赫维茨,通过博弈论的研究推动了机制设计理论的发展。
2012年,罗斯与沙普利根据博弈论创建了稳定分配理论。
2014年,梯若尔在产业组织理论以及串谋问题上,采用了博弈论的思想,让理论和问题得以解决,并且在规制理论上也有创新。
纳什均衡是指在一组组合策略之中,对于每个参与者来说,只要其他人不改变自己的策略,那么他就无法改善自己的状况。简单来说在一种稳定的状态下任何人单独改变策略都得不到好处。
举个例子:我和我的朋友去酒吧去找对象,对面吧台前面有许多美女,一群是金色头发(blonde),还有一群是褐色头发(brunette),此时如果我们要上前搭讪,那么会有这么几种可能性:
①如果我和我的朋友同时找所有的金发女郎搭讪,那么我们找到合适对象的机会是0,因为我们无法深入了解所有人。(0,0)
②如果我的朋友去找所有的金发女郎搭讪,而我去找一位褐发女郎搭讪,那么我成功的概率远大于我的朋友,因为我可以通过足够深入的聊天去了解彼此。(2,5)
③如果我的朋友去找一位褐发女郎搭讪,而我去找所有的金发女郎搭讪,相同的道理我朋友成功的概率会远高于我。(5,2)
④如果我和我的朋友都分别去找一位褐发女郎搭讪,那么我们成功的概率相差无几。(2,2)
在这组找对象的策略组合中,第四种策略即属于纳什均衡策略。也就是说双方可以达到共赢的状态,任何一方变动策略都会是的局面失去平衡。
(1)博弈树
博弈树:又称扩展式博弈模型,由节点、主干、枝干构成的策略组合模型。
如图所示:节点:①、②;主干:U、D;枝干:U‘、D‘
起点①为初始决策点,竞争者:“我”
主干U为“进入”决策的条件:“找所有的金发女郎搭讪”
主干D为“不进入”决策的条件:“找一位褐发女郎搭讪”决策
中间决策点②,竞争者:“我的朋友”
枝干有两个策略:一个是“去找所有金发女郎”,另一个是“去找一位褐发女郎“
决策终止点:决策结果分别为(0,0)和(2,5)
(2)博弈表
(1)囚徒困境
话说甲乙两名囚犯因抢劫罪被捕入狱,警察需要录口供判定二者的罪行:
如果甲乙都招供罪行,那么各判2年;
如果囚犯乙招供所有罪行都是甲做的,甲保持沉默,那么甲判刑10年,乙当庭释放;
如果囚犯乙保持沉默,甲招供所有罪行都是乙做的,那么甲当庭释放,乙判10年;
如果两个人都保持沉默,什么都不肯说,那么警察找不到确切证据判刑,只能各判半年。
1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·帕克以囚徒方式阐述,并命名为“囚徒困境”[2]。 该博弈案例反应的是个人的最优策略并非是集体的最优策略,从案例中可以推出,从最优的策略角度来看,二者都保持沉默不招供,各自只会判半年,然而从人的本性选择来看,却都倾向于招供罪行,因为每个人都怕自己万一保持沉默,对方把罪行全推到自己头上,判10年的罪行。这是人性的弱点所导致的非理性博弈。
(2)智猪博弈
猪圈里有一只大猪和一只小猪,猪圈一边放着一个由绳索钩挂的猪槽,另一边是连接伸缩的踏板,如果它们想吃到食物必须踩一下这一边的踏板,另一边会有10份食物从猪槽里掉下来。无论谁踩踏板,都会消耗2份食物的能量,下面有这几种情况:
两只猪一起踩踏板,大猪比小猪吃得快,大猪吃了8份,小猪才吃了2份。(6,0)
大猪踩踏板,小猪守在槽边,由于小猪没有出力,只能吃4份食物,大猪可以吃6份。(6,6)
小猪踩踏板,大猪守在槽边,大猪吃得比小猪快,小猪跑过来时,10份全被大猪吃完了。(10,-2)
两只猪都不踩踏板,全部没食物吃。(0,0)
在企业中,大企业就好比大猪,中小企业就好比是小猪。控制按钮可以比作技术创新,可以给企业带来收益。大企业资金雄厚,生产力大,有更多的能力进行技术创新,推出新产品后可以迅速占领市场获得高额利润。而小企业的最优选择就是等待,等大企业技术创新后,跟在大企业后,抢占市场份额,从这种创新中获得利益[3] 。
(1) 零和博弈:表示所有博弈方的利益之和为零或一个常数,即一方有所得,其他方必有所失[4] 。生活中的俗语:“不是你死就是我亡”、“非黑即白”。
(2)非零和博弈:是与零和博弈相对的概念,一方有所得,另一方也可能有所得,最终是一个双赢或者双输的局面。生活中的俗语:“合作共赢”、“同归于尽”。
参考文献:
[1]360百科:博弈论
[2]Wikpadia:囚徒困境
[3]MBA智库:智猪博弈
[4]Wikpadia:零和博弈
本文首发于微信公众号“认知与新思维”。
表白方式
直接表白法
1、直接跟对方面对面的说。找个合适的场合和时间,将对方约出来直接跟对方。
2、情书。将自己需要表白的话都写成表白情书。
3、电话、手机表白。在电话手机里面表白可以减少很多的尴尬,不需要直接面对对方的眼神,也许这样对于一些胆子稍微小的人来讲是一种很不错的表白手段。
4、手机短信、网络通讯工具。通过手机短信,QQ消息,E-mail或者流行的微博等表白,用简单的话语说出自己的心声。
间接表白法
1、找那种跟自己要好,跟对方也很好的朋友在双方之间传递爱心。选择这种方式,最关键的是要选好这个中间人,选错人,事情可能会被越搞越砸。
2、可以经常约对方出来玩,比如周末,如果对方不同意可以试着把他身边的朋友也约出来,经常聚在一起,在活动中试探对方,如果可以先收买对方的朋友那就更好了。当然,如果每次都能单独约对方出来,那这事就简单多了。
3、书信方式。平时可以通过书信的方式试着给对方写一些东西,旁敲侧击,书信中能够夹藏着一些暗示,然后观察对方的表现,如果发展良好,到了后期可以表现的越来越明显,也就可以升级成为情书的表白方式。
4、通电话。有事没事在晚上经常给对方电话,想办法与对方多聊,然后时不时的试探对方,一有机会就上。
5、手机短信、网络手段也是可以用的,可以经常发一些半开玩笑形式的话语与对方交流,这样一边暗示,一边观察。
表白被拒绝
1不要沮丧
我明白求爱被拒令你很难过很沮丧,但是你千万不能在表白对象面前表露出你的这种情绪,对方对你并没有恶意,她只是忠于自己,拒绝了不喜欢的你,那是对你负责的表现,你没必要为此怏怏不快,那样只会给她增加压力让他觉得你很幼稚。
2保留隐私
我想你们之间必定会有共同好友,或者是共同认识的人,被拒之后你可以轻描淡写地告诉那些朋友你被拒绝了,但不要把整件事的来龙去脉前因后果都毫无保留地倾泄而出。女人们的人际关系总是很复杂,如果你说了过多不该说的话,传到她耳朵里,你们的关系只能以崩裂收场了。
3振作一点
这个世界上不乏打听八卦的人,如果你很不幸地成为了八卦的主角,请先保持冷静,即使流言蜚语漫天飞舞,你也要保证每天100%的好心情。男人颓废只会让女人看扁,不光要外形魁梧,只有真正内心强大的男人才会赢得女人的欣赏与青睐。
4勇于尝试
即使被拒,你还有勇气去进行第二次告白吗其实,第二次告白的成功率要比第一次来得高。经历过第一次之后第二次应该也没有那么困难了吧,而且这样更能体现出你的诚意。就算被发了第二次好人卡,你也不要灰心,是男人就要勇敢求爱!
扩展式博弈和策略式博弈是博弈模型的两种形式,博弈论也只有这两种形式
1、策略式博弈
2、扩展式转化为策略式
3、策略式转化为扩展式
4、共同知识
5、博弈模型的三点说明
策略式博弈构成
1、做决策的参与者是谁?——参与者集
2、做决策的可选方案是什么?——参与者的策略集
3、参与者如何评估不同决策?——参与者的支付函数(收益)
策略式优势
1、为求解纳什均衡提供方便
2、简单明了
3、便于表示与书写
策略式劣势
1、不能描述参与者行动顺序
2、不能描述参与者在各个决策节点时掌握的信息
3、不能适用于动态博弈模型的表述
如何把扩展式转化为策略式
任何一个博弈都可以用扩展式表示出来
1、找出每个参与者的策略集合,并分别列出(一个按行列出,一个按列列出)
2、在扩展式中找出每个策略组合所对应的行动路径(行动组合)
3、将终端节点旁的支付情况填入相应的策略组合所对应的位置
欢迎分享,转载请注明来源:表白网
评论列表(0条)