首页 万年历 正文内容

博弈是什么意思(零和博弈是什么意思-)

万年历 万年历 2022-12-02 12:04:12 1

Xi总书记在建党一百周年的讲话中谈到外交政策和国际关系时提出了“三个坚持”和“三个不”:坚持合作,不搞对抗,坚持开放,不搞封闭,坚持互利共赢,不搞零和博弈。

这里的零和博弈是什么?

在博弈论中,零和博弈也被称为严格竞争博弈。在这样的游戏中,没有任何形式的合作或联合行动:每个参与者的偏好完全相反,一个人偏好的结果恰好是另一个人最不希望看到的;大家的利益是完全对立的,一个人的获得必然是另一个人的损失。

其实从零和博弈的名字就很容易理解上述性质。零和博弈之所以叫零和博弈,是因为博弈双方(或多方)的得失之和等于零。得失之和等于零,实际上意味着一方有所得,另一方必然有所失。所以零和游戏通俗的理解就是你死我活的斗争。

大多数赌博游戏都是零和游戏。例如,下棋、扑克或“剪刀石头布”是一种零和游戏。这些游戏没有双赢的结果。

在某些游戏中,玩家的利润之和不是零,而是一个常数。这叫做恒和博弈。恒和博弈本质上仍然是一个零和博弈——如果某个玩家的所有利润数字都增加或扣除相同的数字,博弈的性质不变,那么我们只需砍掉博弈的“恒和”值,就可以把一个恒和博弈变成零和博弈,它们的性质是一样的。从所有玩家的利润值中增加或减去一个常数不会改变游戏的性质。原因是利润值代表了玩家的偏好,决定偏好的是值的相对结构,而不是值的绝对大小。所以,和零和博弈一样,恒和博弈是严格竞争的,双方的利益是完全冲突的。分析零和博弈的方法同样适用于恒和博弈。

1928年(约翰·纳西出生的那一年),数学家冯·诺依曼提出了极小极大定理(更准确地说,应该是最小值的最大化)来分析二人零和博弈,推测其均衡结果。极大极小定理的核心思想可以直观地理解为:对于我做出的每一个选择,我的对手都会试图最大化他的收益(从而最小化我的收益——因为他的收益正是我的损失);我选择的每一个可能结果都有一个最小值,我的最佳选择是选择这一系列最小值中最大的一个。基于这一原理的投机结果称为最小-最大均衡。

下面通过二人零和博弈的一个例子来说明最小最大均衡,如下(参与人及其赢利已用不同颜色对应):

下面以两人零和博弈为例来说明最小最大均衡,如下(参与者及其利润已用不同颜色映射):

零和游戏的例子

寻找这个博弈的最小最大均衡的思路如下。以A为例。他的想法是:如果我选择向上,那么我最差的结果是得到-2;如果我选,那么我最差的结果是得到-1;两个最差结果中,-1是最差的(最大和最小),所以我应该选它;另一方会选择右。所以最后的结果会是(下图,右图)。

以B为例,极大极小定理意味着B会这样想:如果我选左,那么我的最坏结果是得到-2;如果我选右,我最差的结果是得到1;两个最差结果中最大的是1,但我选右至少保证1,所以我选右;我的对手会选择。所以结果和以A为例的分析一样,也是(下图,右图)。这不是偶然的。其实不管从哪方面来说,结果都是一样的。

从上面的分析可以看出,游戏的参与者实际上采取的是一种悲观的决策方式:我从我所有的坏结果中选择最不坏的一个。这样,我才会有最少的遗憾。因此,最小最大均衡有时被称为最小遗憾均衡。

后来,23年后,约翰·纳西(前面提到过,记得他是什么时候出生的)提出了一个新的均衡概念,后来被称为纳什均衡。纳什均衡是基于参与者的最优反应行为。仍然以前面的零和博弈为例,其推理如下:A认为B选左时选择最有利,B选右时选择也最有利,所以B选什么都是最好的;b认为A选上最好选右,A选下最好选右,所以不管A怎么选自己都最好选右。结果A选右,B选右,这就是纳什均衡。

在这个例子中,最小最大均衡和纳什均衡是相同的。这不是偶然的。实际上,在零和博弈中,最小最大均衡和纳什均衡是等价的。

然而,零和游戏并不是常态。有很多博弈双方的收益之和不为零(或者是一个常数)。这样的博弈叫做非零和博弈。

非零和博弈中,最小最大均衡和纳什均衡所推测的博弈结果通常是不一样的。下面我们构造了一个非零和博弈的例子(显然,右下角是共赢结果,因为每个人可得到4,这是每个人所能达到的最高价值)。

在非零和博弈中,最小最大均衡和纳什均衡预测的博弈结果通常是不同的。下面我们构造一个非零和博弈的例子(显然右下角是双赢的结果,因为每个人都能得到4,这是每个人能达到的最高值)。

非零和游戏的例子

在这个新例子中,如果用纳什均衡的推理,那么,A对B的最佳反应是:B选左边的上,B选右边的下。而B对A的最佳对策是:A选自己选右,A选自己选右。纳什均衡的结果是:A选下,B选右。他们实现了“双赢”。

如果应用极大极小原理,会得到什么?从A的立场出发,他发现:如果当选,最差是-1;如果当选,最坏的结果是-2,所以他应该当选。站在B的立场,他发现如果他选左边,最差结果是-3,如果他选右边,最差结果是-2,所以他选了右边。结果是A选顶,B选右——这是双方都赔钱的结果。而且也说不通:如果A是理性的,当他发现B选对了,他会后悔为什么不选。这个例子说明,用零和博弈的思想去推理非零和博弈是有问题的。

实际上,极大极小原则只能适用于零和博弈。纳什均衡原理既适用于零和博弈,也适用于非零和博弈。因此,纳什均衡成为现代(非合作)博弈论的核心。人们基本上不再提极小极大原理(但极小极大原理本身不应该被忽视。虽然不再是博弈论的核心,但仍然是极其重要的基石)。

在世界上绝大多数经济和政治活动中,结果都不是零和的。社会上有很多合作,合作的结果通常不是零和,共赢也可以存在。如果用零和博弈的思维去面对非零和博弈问题,结果就很难达到双赢,甚至可能出现损人不利己的情况(比如上例中的“双输”结果)。总书记提出的“坚持合作不对抗、开放不封闭、互利共赢不零和博弈”是高瞻远瞩的战略智慧,也是奉行独立自主的和平外交政策、坚持走和平发展道路的基本准则。

文章目录
    搜索