博弈是什么意思（零和博弈是什么意思-）

万年历万年历 2022-12-02 12:04:12 1

Xi总书记在建党一百周年的讲话中谈到外交政策和国际关系时提出了“三个坚持”和“三个不”:坚持合作，不搞对抗，坚持开放，不搞封闭，坚持互利共赢，不搞零和博弈。

这里的零和博弈是什么？

在博弈论中，零和博弈也被称为严格竞争博弈。在这样的游戏中，没有任何形式的合作或联合行动:每个参与者的偏好完全相反，一个人偏好的结果恰好是另一个人最不希望看到的；大家的利益是完全对立的，一个人的获得必然是另一个人的损失。

其实从零和博弈的名字就很容易理解上述性质。零和博弈之所以叫零和博弈，是因为博弈双方(或多方)的得失之和等于零。得失之和等于零，实际上意味着一方有所得，另一方必然有所失。所以零和游戏通俗的理解就是你死我活的斗争。

大多数赌博游戏都是零和游戏。例如，下棋、扑克或“剪刀石头布”是一种零和游戏。这些游戏没有双赢的结果。

在某些游戏中，玩家的利润之和不是零，而是一个常数。这叫做恒和博弈。恒和博弈本质上仍然是一个零和博弈——如果某个玩家的所有利润数字都增加或扣除相同的数字，博弈的性质不变，那么我们只需砍掉博弈的“恒和”值，就可以把一个恒和博弈变成零和博弈，它们的性质是一样的。从所有玩家的利润值中增加或减去一个常数不会改变游戏的性质。原因是利润值代表了玩家的偏好，决定偏好的是值的相对结构，而不是值的绝对大小。所以，和零和博弈一样，恒和博弈是严格竞争的，双方的利益是完全冲突的。分析零和博弈的方法同样适用于恒和博弈。

1928年(约翰·纳西出生的那一年)，数学家冯·诺依曼提出了极小极大定理(更准确地说，应该是最小值的最大化)来分析二人零和博弈，推测其均衡结果。极大极小定理的核心思想可以直观地理解为:对于我做出的每一个选择，我的对手都会试图最大化他的收益(从而最小化我的收益——因为他的收益正是我的损失)；我选择的每一个可能结果都有一个最小值，我的最佳选择是选择这一系列最小值中最大的一个。基于这一原理的投机结果称为最小-最大均衡。

下面通过二人零和博弈的一个例子来说明最小最大均衡，如下（参与人及其赢利已用不同颜色对应）：

下面以两人零和博弈为例来说明最小最大均衡，如下(参与者及其利润已用不同颜色映射):

零和游戏的例子

寻找这个博弈的最小最大均衡的思路如下。以A为例。他的想法是:如果我选择向上，那么我最差的结果是得到-2；如果我选，那么我最差的结果是得到-1；两个最差结果中，-1是最差的(最大和最小)，所以我应该选它；另一方会选择右。所以最后的结果会是(下图，右图)。

以B为例，极大极小定理意味着B会这样想:如果我选左，那么我的最坏结果是得到-2；如果我选右，我最差的结果是得到1；两个最差结果中最大的是1，但我选右至少保证1，所以我选右；我的对手会选择。所以结果和以A为例的分析一样，也是(下图，右图)。这不是偶然的。其实不管从哪方面来说，结果都是一样的。

从上面的分析可以看出，游戏的参与者实际上采取的是一种悲观的决策方式:我从我所有的坏结果中选择最不坏的一个。这样，我才会有最少的遗憾。因此，最小最大均衡有时被称为最小遗憾均衡。

后来，23年后，约翰·纳西(前面提到过，记得他是什么时候出生的)提出了一个新的均衡概念，后来被称为纳什均衡。纳什均衡是基于参与者的最优反应行为。仍然以前面的零和博弈为例，其推理如下:A认为B选左时选择最有利，B选右时选择也最有利，所以B选什么都是最好的；b认为A选上最好选右，A选下最好选右，所以不管A怎么选自己都最好选右。结果A选右，B选右，这就是纳什均衡。

在这个例子中，最小最大均衡和纳什均衡是相同的。这不是偶然的。实际上，在零和博弈中，最小最大均衡和纳什均衡是等价的。

然而，零和游戏并不是常态。有很多博弈双方的收益之和不为零(或者是一个常数)。这样的博弈叫做非零和博弈。

非零和博弈中，最小最大均衡和纳什均衡所推测的博弈结果通常是不一样的。下面我们构造了一个非零和博弈的例子（显然，右下角是共赢结果，因为每个人可得到4，这是每个人所能达到的最高价值）。

在非零和博弈中，最小最大均衡和纳什均衡预测的博弈结果通常是不同的。下面我们构造一个非零和博弈的例子(显然右下角是双赢的结果，因为每个人都能得到4，这是每个人能达到的最高值)。

非零和游戏的例子

在这个新例子中，如果用纳什均衡的推理，那么，A对B的最佳反应是:B选左边的上，B选右边的下。而B对A的最佳对策是:A选自己选右，A选自己选右。纳什均衡的结果是:A选下，B选右。他们实现了“双赢”。

如果应用极大极小原理，会得到什么？从A的立场出发，他发现:如果当选，最差是-1；如果当选，最坏的结果是-2，所以他应该当选。站在B的立场，他发现如果他选左边，最差结果是-3，如果他选右边，最差结果是-2，所以他选了右边。结果是A选顶，B选右——这是双方都赔钱的结果。而且也说不通:如果A是理性的，当他发现B选对了，他会后悔为什么不选。这个例子说明，用零和博弈的思想去推理非零和博弈是有问题的。

实际上，极大极小原则只能适用于零和博弈。纳什均衡原理既适用于零和博弈，也适用于非零和博弈。因此，纳什均衡成为现代(非合作)博弈论的核心。人们基本上不再提极小极大原理(但极小极大原理本身不应该被忽视。虽然不再是博弈论的核心，但仍然是极其重要的基石)。

在世界上绝大多数经济和政治活动中，结果都不是零和的。社会上有很多合作，合作的结果通常不是零和，共赢也可以存在。如果用零和博弈的思维去面对非零和博弈问题，结果就很难达到双赢，甚至可能出现损人不利己的情况(比如上例中的“双输”结果)。总书记提出的“坚持合作不对抗、开放不封闭、互利共赢不零和博弈”是高瞻远瞩的战略智慧，也是奉行独立自主的和平外交政策、坚持走和平发展道路的基本准则。