博弈论策略如何改善决策 编辑

博弈论,战略决策的研究,汇集了不同的学科,如数学,心理学和哲学。博弈论是由约翰·冯·诺依曼和奥斯卡·摩根斯坦在1944年发明的,从那时起已经走过了漫长的道路。博弈论对现代分析和决策的重要性可以通过这样一个事实来衡量:自1970年以来,多达12位著名经济学家和科学家因对博弈论的贡献而获得诺贝尔经济科学奖。

博弈论应用于许多领域,包括商业、金融、经济学、政治学和心理学。理解博弈论策略——流行的策略和一些相对不太为人所知的策略——对于增强一个人的推理能力和理解力是很重要的决策 复杂世界中的技能。

关键要点

  • 博弈论是一个理解竞争对手在不同情况下的选择的框架。
  • 博弈论可以帮助玩家在战略环境中面对独立的、相互竞争的参与者时达到最优决策。
  • 在经济和商业环境中出现的一种常见的“博弈”形式是囚徒困境,即个体决策者总是有一种选择的动机,这种选择会给作为一个群体的个体带来不太理想的结果。
  • 还有其他几种形式的博弈。这些博弈的实际应用可以成为一种有价值的工具,有助于分析行业、部门、市场以及两个或多个参与者之间的任何战略互动。

囚徒困境

最流行和最基本的博弈论策略之一是囚徒困境 . 这一概念探讨了两个人所采取的决策策略,他们以自己的最佳利益行事,结果比当初合作的结果更糟。

在囚徒困境中,两名因犯罪而被捕的嫌疑人被关在不同的房间里,不能相互交流。检察官分别通知1号和2号嫌疑人,如果他供认和作证反对对方,他可以自由,但如果他不合作,而另一名嫌疑人合作,他将被判处三年监禁。如果两人都认罪,将被判处两年徒刑,如果两人都不认罪,将被判处一年有期徒刑。

虽然合作是两名嫌疑人的最佳策略,但研究表明,当面临这样的困境时,大多数理性的人更愿意坦白和指证对方,而不是保持沉默,抓住对方坦白的机会。

假设游戏中的玩家是理性的,并且会努力使他们在游戏中的收益最大化。

囚徒困境为先进的博弈论策略奠定了基础,其中流行的策略包括:

匹配的便士

这是一个零和博弈 这需要两个玩家(称他们为玩家A和玩家B)同时把一分钱放在桌子上,其回报取决于分钱是否匹配。如果两个硬币都是正面的或反面的,玩家A获胜并保留玩家B的硬币。如果他们不匹配,球员B获胜并保留球员A的一分钱。

僵局

这是一个类似囚徒困境的社会困境场景,因为两个参与者可以合作,也可以叛逃(即不合作)。在死锁中,如果玩家a和玩家B都合作,他们每人得到1的回报,如果他们都叛逃,他们每人得到2的回报。但是如果玩家A合作而玩家B失败,那么A得到的回报是0,B得到的回报是3。在下面的支付图中,(a)到(d)单元格中的第一个数字表示玩家a的支付,第二个数字表示玩家B的支付:

死锁支付矩阵 玩家B玩家B
  合作缺陷
玩家A合作(a) 1,1(b) 0,3个
 缺陷(c) 3,0(d) 2,2

僵局与囚徒困境的不同之处在于,双方利益最大的行动(即双方都有缺陷)也是主导策略。一个玩家的主导策略被定义为在任何可用策略中产生最高回报的策略,而不管其他玩家采用什么策略。

一个经常被引用的僵局例子是,两个核大国试图达成一项协议,消除它们的核弹库。在这种情况下,合作意味着遵守协议,而叛逃意味着秘密背弃协议,保留核武库。不幸的是,对任何一个国家来说,最好的结果就是背弃协议,保留核选择权,而另一个国家则取消其核武库,因为如果两国之间爆发战争,这将使前者比后者拥有巨大的潜在优势。第二个最好的选择是双方叛逃或不合作,因为这保留了他们作为核大国的地位。

古诺竞争

这个模型在概念上也类似于囚徒困境,并以1838年引进它的法国数学家奥古斯丁·古诺命名。最常见的应用古诺模型是在描述双头垄断 一个市场中的两个主要生产商。

例如,假设A公司和B公司生产相同的产品,可以生产大量或少量的产品。如果双方都合作并同意以低水平生产,那么产量将受到限制供应 这将转化为产品在市场上的高价以及两家公司的可观利润。另一方面,如果他们的缺陷和高水平的生产,市场将被淹没,并导致产品的低价格,从而降低双方的利润。但是,如果一方合作(即低水平生产)而另一方存在缺陷(即秘密地高水平生产),则前者只能收支相抵,而后者的利润高于两者合作;

公司A和B的回报矩阵如图所示(数字以百万美元表示利润)。因此,如果A合作并以低水平生产,而B缺陷并以高水平生产,回报如单元格(B)所示-A公司盈亏平衡,B公司盈利700万美元。

古诺支付矩阵 B公司B公司
  合作缺陷
A公司合作(a) 4,4(b) 0,7个
 缺陷(c) 7,0(d) 2,2

协调博弈

在协作中,当玩家选择相同的行动方案时,他们会获得更高的回报。

举个例子,想想两个科技巨头,他们正在决定是在内存芯片中引入一项激进的新技术,这项技术可以为他们带来数亿美元的利润,还是在旧技术的基础上进行修订,这项技术的利润要少得多。如果只有一家公司决定采用新技术,采用率 因此,如果两家公司采取相同的行动方案,它的收入将比两家公司低得多。收益矩阵如下所示(数字以百万美元表示利润)。

因此,如果两家公司都决定引进这项新技术,他们每人将获得6亿美元的收入,而引进旧技术的修订版将使他们每人获得3亿美元的收入,如单元格(d)所示。但如果A公司单独决定引进这项新技术,它只能赚1.5亿美元,即使B公司赚0美元(大概是因为消费者可能不愿意为它现在过时的技术买单)。在这种情况下,两家公司合作而不是单独合作是有意义的;

协调季后赛矩阵 B公司B公司
  新技术旧技术
A公司新技术(a) 600,600(b) 0,150个
 旧技术(c) 150,0(d) 300,300

蜈蚣游戏

这是一个广泛的形式游戏中,两个玩家交替得到一个机会,以采取更大的份额慢慢增加的钱藏。这个蜈蚣游戏 是连续的,因为玩家一个接一个地移动,而不是同时移动;每个玩家也知道在他们之前玩过的玩家选择的策略。当一个玩家拿走藏宝时,游戏就结束了,这个玩家得到了较大的一部分,而另一个玩家得到了较小的一部分。

例如,假设玩家A先走,必须决定是“拿走”还是“通过”藏品,目前藏品金额为2美元。如果他拿走了,那么A和B各得到1美元,但是如果A通过了,那么现在必须由球员B决定是拿走还是通过。如果B拿走了,她得到3美元(即之前的2美元+1美元),A得到0美元。但是如果B通过了,A现在可以决定是通过还是通过,依此类推。如果两个玩家都选择通过,他们每个人在游戏结束时都会得到100美元的回报。

游戏的重点是,如果A和B双方合作,并继续通过游戏,直到游戏结束,他们将获得每人100美元的最高支付。但如果他们不信任另一方,并期望他们在第一时间“抓住”机会;纳什均衡 预测玩家将接受最低可能的索赔(本例中为1美元)。然而,实验研究表明,这种“理性”行为(如博弈论所预测的)很少在现实生活中表现出来。考虑到初始支付相对于最终支付的规模很小,这在直觉上并不令人惊讶。实验对象的类似行为也出现在旅行者困境中。

旅行者困境

经济学家Kaushik Basu在1994年设计了一种非零和博弈,双方都试图在不考虑对方的情况下最大化自己的支出。例如,在旅行者困境 ,一家航空公司同意赔偿两名旅客相同物品的损失。不过,这两位旅客需要分别估算物品价值,最低2元,最高100元。如果双方都记下相同的价值,航空公司将向他们每人偿还该金额。但如果价值不同,航空公司将向他们支付较低的价值,记下较低价值的旅客将获得2美元的奖金,记下较高价值的旅客将受到2美元的罚款。

纳什均衡水平,基于反向诱导 ,在这种情况下是2美元。但与蜈蚣游戏一样,实验室实验始终显示,大多数参与者无论是否天真,都会选择一个比2美元高得多的数字。

旅行者困境可以用来分析现实生活中的各种情况。例如,反向归纳的过程可以帮助解释两个参与残酷竞争的公司如何稳步地降低产品价格,以获取利润市场份额 这可能导致他们在这个过程中遭受越来越大的损失。

两性之战

这是前面描述的协调博弈的另一种形式,但有一些回报不对称。这基本上是一对夫妇试图协调他们的夜晚外出。虽然他们同意在球赛(男人的喜好)或戏剧(女人的喜好)上见面,但他们忘记了自己的决定,而且为了解决这个问题,他们不能互相交流。他们应该去哪里?回报矩阵如下所示,单元格中的数字分别表示女性和男性享受活动的相对程度。例如,单元格(a)表示男女在剧中的回报(就享受程度而言)(她比他享受得多)。如果两个人都参加了球赛(他比她更喜欢球赛),那么牢房(d)就是回报。单元格(c)表示两人不仅去了错误的地点,而且去了他们最不喜欢的活动——女人去打球,男人去打球——的不满。

两性之战收益矩阵 男人男人
  球赛
女人(a) 6,3号(b) 2,2
 球赛(c) 0,0(d) 3,6号

独裁者游戏

这是一个简单的游戏,玩家a必须决定如何与玩家B分享现金奖品,而玩家B对玩家a的决定没有任何意见。虽然这不是一个博弈论策略本身,它确实为人们的行为提供了一些有趣的见解。实验显示,大约50%的人把所有的钱都留给自己,5%的人平分,另外45%的人给其他参与者一个较小的份额。独裁者博弈与最后通牒博弈密切相关,在最后通牒博弈中,玩家A得到一定数量的金钱,其中一部分必须给玩家B,玩家B可以接受或拒绝给出的金额。如果第二个玩家拒绝提供的金额,则A和B将一无所获。独裁者和最后通牒游戏对慈善捐赠和其他问题有重要的借鉴意义慈善事业 .

和平战争

这是囚徒困境的一种变体,在囚徒困境中,“合作或缺陷”的决定被“和平或战争”所取代打价格战. 如果双方都不降价,他们就会相对繁荣(单元格a),但是;价格战 会大大减少收益(单元格d)。然而,如果A参与降价(即“战争”),而B不参与,A将获得更高的回报4,因为它可能能够获得可观的市场份额,而这一更高的数量将抵消较低的产品价格。

和平战争回报矩阵 B公司B公司
  和平战争
A公司和平(a) 三,三(b) 0,4个
 战争(c) 4,0(d) 1,1

志愿者的困境

在志愿者的困境中,有人为了共同的利益不得不承担家务或工作。如果没有人自愿,最坏的结果就会出现。例如,假设一家公司会计造假猖獗 但最高管理层对此并不知情。会计部门的一些初级员工知道欺诈行为,但不愿告诉最高管理层,因为这会导致参与欺诈的员工被解雇,而且很可能会被起诉。

被标记为举报人 也可能会产生一些影响。但如果没有人自愿,这种大规模的欺诈行为可能会导致公司最终破产破产 以及所有人的失业。

常见问题

博弈论中的博弈是什么?

它被称为博弈论,因为博弈论试图理解两个或两个以上的“参与者”在包含既定规则和结果的给定情境中的战略行为。博弈论在许多学科中都有应用,但在商业和经济学的研究中,博弈论是最著名的工具。因此,“博弈”可能涉及两个竞争对手公司对另一个公司降价的反应,一个公司是否应该收购另一个公司,或者股票市场的交易者对价格变化的反应。从理论上讲,这些;游戏可以分类 &类似于囚犯的困境,独裁者游戏,鹰和鸽,两性之战,以及其他一些变体。

囚徒困境教会了我们什么?

囚徒困境表明,简单的合作并不总是符合一个人的最佳利益。事实上,在购买汽车等高价商品时,从消费者的角度来看,讨价还价是首选的做法。否则,汽车经销商可能会在价格谈判中采取不灵活的政策,使其利润最大化,但会导致消费者为其车辆支付过高的费用。了解合作与叛逃的相对收益可能会刺激您参与重大的;价格谈判 在您进行大采购之前。

博弈论中的纳什均衡是什么?

博弈论中的纳什均衡是指一个博弈者在考虑了对方的策略后,在没有动机偏离策略的情况下,继续执行自己选择的策略。

企业如何在相互竞争时运用博弈论?

例如,古诺竞争(Cournot competition)是一种经济模型,描述的是一种产业结构,在这种结构中,提供相同产品的竞争对手在各自生产的产品数量上相互竞争,既独立又同时竞争。这实际上是一个囚徒困境游戏。

底线

博弈论可以非常有效地作为一种决策工具,无论是在对抗、商业还是个人环境中。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

词条统计

浏览:18 次

字数:17688

最后编辑:8 年前

编辑次数:0 次

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文