博弈论混合策略经典例子,混合策略博弈的解法

假设博弈中的每一个局中人在博弈开始前就已经设想了可能发生的一切情形,并做出了相应的应对决策,也就是说局中人事先已经对博弈有了一套完整的计划,只要局中人对于每一种

b511fc325b114d6e829d30bf22393fc8~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=n5p3cR94mfeMxyvrJlg%2FBhK1pgE%3D

假设所有参与游戏的玩家在游戏开始前已经想象了所有可能的情况并决定了相应的反应。换句话说,玩家被认为提前对所有可能出现的情况有一个完整的游戏计划。此时他拥有的任何情报信息都与游戏规则提供给玩家的信息形式相匹配,并且该计划揭示了他将选择什么行动。

这时,这个计划就被称为“策略”。

5b6ee1cd-9b1b-4aae-aac9-9a17847e48e2~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=2I0YDD4i4Jd%2BQoucA6yvqD5CKIU%3D

相信很多人都玩过井字游戏,但如果你先走,只要你做对了,你的对手就无法获胜。另一方面,如果你的对手使用了正确的先发策略,你将无法击败对手。

对于这种类型的游戏,最终的结果是随机的。

假设在游戏中,参与者轮流将硬币放在桌子上。如果游戏中的一名玩家无法投硬币,则该玩家游戏失败。如果你是这款游戏的第一名玩家,你将采取完美的策略来确保最终的胜利。最简单且最常用的策略是第一个玩家将一枚硬币放在圆桌中央。通过这种方法,先走的玩家可以将自己的硬币放在圆桌中央,无论对手将其放在哪里。这保证了第一个玩家永远不会输,只有输掉比赛的人才能成为对手。

4f1f0d8f-4c70-4942-b5a3-af26db1a4e12~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=36kCdMu0VYeb5QGCFiqaD2E5FgU%3D

国际象棋实际上就像上面的游戏一样简单。假设游戏的双方参与者都有很好的计算能力,那么游戏的结果是:双方最终打平,先手者获胜。最后移动的人一定会获胜。

虽然我们不知道最终博弈的结果会是什么,但通过逆向博弈推理,博弈论有足够的证据证明国际象棋一定具有这个简单的性质。

如果我们把国际象棋视为一个简单的游戏,那么猜硬币就不属于此类游戏。如果参与猜硬币的双方都想保持一致,如果一方选择正面,另一方也必须选择正面。然而,如果第一个玩家选择正面,并且对手知道第一个玩家的选择,则对手将选择反面来击败第一步。此时,第一个玩家再次选择反面,如果对手知道这一点,则选择正面。从这个角度来看,这是一个无限循环。

4175e15e-7cf9-482f-82f0-dc5360505718~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=bo1jJncPTfacvbMh6rvDsqFn6fo%3D

通过这样的游戏,你会清楚地知道,如果你不想让你的伴侣知道你的秘密,你自己也不想知道它。也许你可以抛硬币并使用正面和反面来确定在这种随机决策下最终获胜的概率,即使你的对手非常理性并且知道你的策略。就一半。

我们经常玩的“石头剪刀布”、“硬币配对”等游戏,都是两个人玩的零和问题。然而,这些游戏中的问题往往包含参与者自身经历、生活常识等影响因素。

例如,有些人玩过的“铜匹配”游戏只是两种游戏的策略选择方法:“正面”或“反面”。最重要的是参与游戏的人要猜哪一个。这种方法难度很大,而且看起来不规则。这款游戏的游戏规则非常明确,如果一个玩家做出自己的决定,另一位玩家将无法得知对手的选择。

531101bb-38b9-4100-ac11-a4b0450778c8~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=LjgjWQoxj9cNw6TGxfDmS6fZAQw%3D

然而,这种说法仅在理论层面上考虑,并不适用于现实生活中玩类似游戏时。假设两个玩家玩一个名为“匹配铜币”的游戏。一名玩家在这场游戏中并没有刻意猜测对手的意图,而另一名玩家则是智力一般的玩家。所以这个玩家在游戏中要做的就是让对手猜不到他的策略。

因此,在连续的回合中,您将随机地玩“正面”或“反面”。事实上,我们需要了解的是玩家在同一场游戏中的游戏策略,而不是讨论玩家在一系列游戏中的策略,我们需要研究和讨论一场游戏。假设游戏的玩家不使用正面或反面,但规定正面的概率是1/2,反面的概率也是1/2。

50792aa8-41aa-4f21-b733-7d4677bdd99d~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=QOgrWbsV569VfgCKKqTrMc0yqWo%3D

为了保证游戏的合理性,游戏中的玩家在选择行动之前会采用随机的方式,要么玩“正面”,要么玩“反面”,这样玩家的利益就不会受到损害。这种假设的好处是,无论对手选择哪一方,前一个玩家对游戏的期望值始终为0。这种方法的特别之处在于,如果一方有信心另一方会玩正面或反面,则整个游戏的数学期望值为零。

这时候,如果对手在游戏中选择了与玩家相同的做法,那么结果自然也是一样的。我们假设“铜匹配”游戏中的玩家被预先配置为独立选择和整合他们认为有机会获胜的所有策略。在这种情况下,可以保证您的利益不会受到损害。因此,采用这种决策方式,无论对方做出什么选择,你都不会损失任何利润。同样,如果你的对手也使用这个策略,那么上一局的人无论做什么都无法获胜。

b9d661e2-5bfa-4ac3-ba26-6f4bf5aff5fa~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=JaTqalnl5pIKyNOSXvOwhFGMdUo%3D

“石头、剪刀、布”游戏也是如此,每个游戏都有三种可能的方式,所以你可以选择所有可能的“混合”方式,类似于上面的“对齐硬币”游戏。最佳游戏策略。除了“配对铜牌”游戏外,您还可以研究基于生活内容或文学的游戏,例如福尔摩斯系列中的下一个故事。

夏洛克·福尔摩斯不顾一切地逃离一直追捕他的莫里亚蒂教授,离开伦敦,前往多维尔港,并从那里前往欧洲。然而,一切都和他想象的不一样。当他上车准备出发时,月台上出现了一张他最不想看到的脸。在福尔摩斯看来,当敌人发现自己时,他一定会以特殊的方式追上来。如果福尔摩斯此时想要逃离敌人的话,他有两个选择:要么直接前往多维尔港,要么。或者,您只能在坎特伯雷下车,这是前往多维尔港的中间站。

a9e7eb0c-0134-467c-8c9a-df0409f8b6d1~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=WrWDxj%2Bf5TiHvhml%2BaAVjjfHnsQ%3D

现在,如果福尔摩斯的对手足智多谋,预见到了这种情况,并且和福尔摩斯有同样的选择,他们都会选择在同一个地方下车。假设双方都不确定对方的行动决定,如果使用上述方法后最终在同一个地方下车,那么答案就很明显了,夏洛克·福尔摩斯肯定会落在莫里亚蒂教授的手里。

相反,如果福尔摩斯安全抵达多维尔港,他就能逃离莫里亚蒂教授的手中,并按照他的计划成功起飞。

cc2d2ee6-fce5-4ea3-b63a-94041d3def3d~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=sIsskC6LdopEvcTPGudnSyi4SMg%3D

此时,您不禁想知道哪种策略是游戏中的最佳选择。特别是在这个故事中,夏洛克·福尔摩斯可以做出哪些决定来确保他逃离莫里亚蒂教授的手中?两人之间的游戏类似于“硬币匹配”游戏。也就是说,莫里亚蒂教授是真心希望他能够在这场游戏中取得成功。

游戏策略有两种类型。

第一个是福尔摩斯安全抵达多维尔港,但莫里亚蒂教授仍留在坎特伯雷。这意味着福尔摩斯是这场游戏的胜利者。

其次,福尔摩斯虽然成功逃离了目的地莫里亚蒂教授的追捕,但最终没能到达欧洲,本场比赛算是平局。

6557d297-717d-46be-8559-d836f3571718~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717886487&x-signature=CTfbahq6PGr6CbvvRur%2F2%2BSEvNk%3D

原创文章,作者:小条,如若转载,请注明出处:https://www.sudun.com/ask/87053.html

(0)
小条's avatar小条
上一篇 2024年6月2日 上午6:32
下一篇 2024年6月2日 上午6:41

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注