囚徒困境

最著名的非合作博弈例子, 就是囚徒困境。1950年,在纳 什的基础上,梅尔文•德雷希尔 和梅里尔•弗拉德共同设计了 这个案例。囚徒困境是指,两 名被捕的犯人被分开审讯,他 们有如下选择:如果都指证对 方,他们将被判中等时间长度 (三年)的监禁,虽然痛苦但 还可以忍受;如果都不指证对 方,他们将被判很短时间(六个 月)的监禁,这样最好;然而, 如果其中一个人指证另一个 人,而被指证的人保持沉默, 那么前者将被无罪释放,而后 者将被判长期监禁(十年), 人生也就此毁掉。

每一个犯人面临的困境是: 是背叛还是忠诚呢?如果背叛 搭档,那么他将得到自由或中 等程度的监禁。如果相信搭档 并选择保持沉默,那么他要么 被短期监禁,要么将忍受很长 时间的牢狱之灾。为了降低“被 骗者的回报”即被长期监禁的可 能性,纳什均衡的策略通常是背 叛搭档。有趣的是,彼此背叛 这一占优(最好的)策略并没 有实现整体福利最大化。如果 他们都保持沉默,他们的总监 禁时间将达到最短。

梅尔文•德雷希尔和梅里 尔•弗拉德用他们的两个同事做 了 “囚徒困境”实验,以检测 纳什的预测是否正确。在这个 游戏里,每个玩家都可以选择 忠于或背叛对方。既可能因被 背叛而损失惨重,又有双赢的 合作方案,这一方案反映了冯• 诺依曼和摩根斯顿早期的合作 博弈研究结论。实验共进行了 100次。游戏的重复使玩家可以 惩罚或奖赏搭档之前的行为。 结果显示,背叛的纳什均衡只 出现了 14次,而合作的方案被 选择了 68次。梅尔文•德雷希 尔和梅里尔•弗拉德据此得出结 论,现实中人们会很快地学习 并进行调整以实现自身收益的 最大化。而纳什则认为,这个 实验本身存在缺陷,因为它存 在着太多的相互作用,真正的 均衡选择仍然应该是背叛。