囚徒困境是什么意思本质(囚徒困境是什么意思)

时刻小站 113

相信我们都有过这样的经验:当我们在公路上遇到塞车的时候,如果都规规矩矩地排在车道内,而有一个人违规驶入人行道,那么他就会得到便宜。

但如果每个人都有这样的想法,并且付诸行动的话,则交通堵塞,人人都吃亏。这样的情况经常在我们的日常生活中出现,即每个人都守规矩,那么一个不守规矩的人就会获得好处;若每个人都不守规矩,则人人都会失利。

这样的现象背后,隐藏着囚徒困境的秘密。以下,Enjoy:

董志强 | 作者

身边的经济学 | 来源

01

囚徒困境模型

两个人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一个人供认或两个人都供认。即使两个人都不供认,也可判他们犯盗窃物品的轻罪。

囚徒被分离审查,不允许他们之间互通消息,并交代政策如下:

如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判三年监禁;

如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;

如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、盗窃罪以及抗拒从严而被重判5年。

我们用赢利表将两名囚徒面临的博弈问题表示如下(见图3-1):

图3-1 囚徒的困境

赢利表是两个局中人且策略离散情形常用的一种表达博弈的工具。

其解读方式是这样的:

最左边是局中人1(本例中为囚徒甲),最上边是局中人2(本例中为囚徒乙);

左边的拒供供认是局中人1的策略,上边的拒供供认是局中人2的策略;

四个单元格是双方策略的组合情况(本例中每人有2个策略,策略组合就为2×2=4(种)),每个单元格即一种策略组合;

每个单元格中有两个数字,第一个数字代表局中人1(左边那个人)的赢利,第二个数字代表局中人2(上边那个人)的赢利。

从图3-1赢利表中可发现,如果两个囚徒都拒供,则每个人判0.5年;如果两个囚徒都供认,则每个人判3年。相比之下,两个囚徒都拒供是对大家来说最好的结果,都供认则是最糟糕的结果。

但是,这个对大家最好的结果实际上不容易发生。

因为每个囚徒都会发现:

如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择;

如果对方供认,则自己供认将被判3年,而自己拒供则会被判5年,因此供认是较好的选择;

因此无论对方拒供或供认,自己选择供认始终是更好的。

由于每个囚徒都发现供认是自己更好的选择,于是,博弈的稳定结果是两个囚徒都会选择供认。我们把这种稳定结果称为博弈的纳什均衡。

这样的结果多少有点令人意外。他们为什么不可以订立一个攻守同盟,都选择拒供从而获得一个对大家都更有利的结果呢?

若两个人在被捕前曾在关二爷面前发誓绝不招供,那么他们能不能达成合作,选择拒供呢?

即使如此,同盟可能还是难以结成的,原因很简单,一旦两个人被捕面临隔离审查,每个人会担心对方背弃盟约。

如果囚徒甲是坚守盟约的人,那么囚徒乙正好可以在事前诱使他订立盟约,然后被捕后囚徒乙就可以通过背盟而逍遥法外。

囚徒甲当然也很清楚做一个坚守盟约的人很可能被囚徒乙利用,所以他为什么要坚持盟约呢?

反过来,如果乙是坚守盟约者,推理也一样。结果是,两个囚徒之间不可能达成稳定的盟约。

囚徒困境通常被看作个人理性冲突和集体理性冲突的经典情形。

因为在囚徒困境局势中,每个人根据自己的利益做出决策,但是最后的结果却是集体遭殃。

现实中诸多的问题和现象,正是囚徒困境问题的翻版。

02

现实中的囚徒困境

价格战是市场竞争中一个非常常见的现象。上网搜索,我们可以发现家电、手机、空调、飞机票……无不充满价格战,而我要讲的例子是彩电价格战上的一段插曲。

自20世纪90年代中期以来,彩电行业竞争加剧,价格战烽烟四起。由于彩电行业是寡头控制,最大的9家彩电厂商占据了70%的彩电市场,这样的市场上博弈互动的特征就更为突出。

1999年4月,长虹为扩大市场突然宣布彩电降价,这给彩电业带来了巨大震动。随即,康佳、TCL、创维达成默契:建立彩电联盟。

直到4月20日下午,康佳仍表示不降价,但当晚康佳突然改变主意,搞得TCL、创维措手不及。4月24日,本来三方准备坐下来商讨降价后的进一步策略,结果又是康佳爽约,于是价格战立即蔓延开来。

但是,大家都降价对于扩大各自的市场其实并无多大帮助,反而削减了各自的利润——这是有事实为证的,1996~2000年,彩电行业连续发生8次大的降价战斗,信息产业部统计资料显示,中国彩电行业进入全面亏损。

信息产业部有关官员透露,彩电价格战使国家损失147亿元,一位彩电企业的老总却说,整个行业的实际损失最少200亿元。

价格战于人于己都不利,但为什么彩电厂商还在打价格战呢?我们可以建立一个简单的囚徒困境博弈来加以解释。

假设彩电市场有两个寡头,现在面临降价与不降价的选择。

甲降价而乙不降价,甲扩大了市场,赢利增加80个单位,乙市场缩小,赢利增加-100个单位;

反之,乙降价而甲不降价,则乙增加80个单位,甲增加-100个单位。

倘若都降价,则各增加-50个单位;

倘若都不降价,则都保持原来的销售利润,增加利润为0。

整个选择及其结果可以用赢利表表示(见图3-2):

图3-2 彩电价格战

显然,从双方最好的结果来看,就是都不降价。

但如同囚徒困境一样,降价是每个企业的优势策略:给定对方不降价,我最好降价(不降价得到0,降价得80);给定对方降价,我更得降价(不降价得-100,降价得-50)。

当然,大家可能还会想,企业之间是否可以进行某种联合来维持价格不降呢?

真实的情况是,2000年6月9日,TCL、海信、创维、厦华、乐华、金星、熊猫、西湖等9家彩电企业歃血结盟,召开了第一次具有垄断意味的彩电联盟峰会,实际上就是一个价格联盟。

结果到联盟生效之日时,大多数彩电商家仍然保持降价,联盟成为一纸空文。当年8月,康佳响应长虹在全国范围内降价20%,撕毁本无约束力的联盟协议,价格联盟宣告破产。

03

如何走出囚徒困境?

如何走出囚徒困境?

假如每个拒供的囚徒都可以在刑满释放后对供认的囚徒实施报复(比如报复他的家人),那么每个囚徒就可能因担心未来的报复而在现在选择拒供,使得拒供,拒供成为均衡的结果。这样合作就达成了。

不过,这种合作是脆弱的,警方可以轻易摧毁此类合作。

比如,宣布对拒供者判处死刑,就会使得上述合作机制失去效力。因为,对方拒供而自己供认,实际上对方已经被置于死地,有谁会担心一个死人的报复呢?

由囚徒当事人的报复机制形成的合作虽然脆弱,但是提供了一条走出囚徒困境的可行思路:只要对囚徒不合作行为的惩罚是足够的并且是可信的,那么就可以使囚徒的行动转到合作的轨道上来。

现实中,的确有很多犯罪团伙的成员,被捕后拒不坦白,这在很大程度上与一个由第三方实施的惩罚机制有关。

因为在犯罪团伙、黑社会中,如果出卖兄弟,则将永远无法在江湖立足,并且其家人也将受到黑社会的追杀。正是这样的第三方惩罚机制,使得报复和惩罚是可信的,从而促成了囚徒的合作。

在囚徒困境中,每个囚徒之所以选择供认,是因为每个囚徒都发现选择供认是符合个人利益的。他们当然也清楚这种自利行为的后果是集体失利,每个人的状况都将更糟糕。

因此,如果每个人都相信对方不会招供,并且每个人都相信对方相信自己不会招供,每个人都相信每个人都相信对方相信自己不会招供,那么合作拒供的结果也可以出现。

在这里,合作的关键是相互信任,以及对相互信任的相互信任。

也就是说,如果可以克服信任问题,那么合作达成也是可能的。顺理成章,促进信任的人质方案,常常也会促进合作,走出囚徒困境。

囚徒困境被认为是人类社会一个非常糟糕的问题。人们自利的做法结果是使每个人都受到伤害。因此,人们常常为如何走出囚徒困境而殚精竭虑。

但是,我个人的看法是,如果能想出克服囚徒困境的办法当然是最好,不过即便一时想不出好办法也不必过于担忧。

人类的理性大概有时候会提醒人们不要陷入万劫不复的境地。

尽管我们看到生活中确实存在大量的囚徒困境,但是面临灾难性的囚徒困境的时候,人们常常还是能够表现出一种合作行为的。

这样看来,人类面临的囚徒困境问题可能没有想象中的那么严重,至少没有严重到危害人类社会安全的地步。

现实中诸多问题都是囚徒困境的翻版,比如价格战、军备竞赛、公共资源的滥用、道路的拥塞、学校走不出应试教育的阴影、团队生产中的偷懒、业绩考核中的分数漂浮等。

有一些方法可以帮助人们走出囚徒困境。

比如对不合作者进行惩罚、对不合作行为形成报复能力、通过人质增加信任、建设忠诚文化、建立长期关系等,都是不错的方法。

囚徒困境并不总是糟糕的,有时设计得当,人们也可以通过制造囚徒困境来为自己谋取好处。

关于作者:董志强,华南师范大学经济行为科学重点实验室主任,经济与管理学院副院长,广东省"珠江学者"特聘教授,博士生导师。

本文整理自《身边的博弈》,经出版方授权身边的经济学原创首发。

上一篇:

下一篇:

  同类阅读

分享