2003年上赵南元老师的认知科学导论这门课的时候,写的课程论文。因为蛋扯得比较圆,得了一个不错的成绩。是大学期间分数最高的一门课。
当我写“我结婚一定会慎重”这句话的时候,肯定没想到婚姻离自己已经很近了。
囚徒困境问题图解及变形
December 31, 2003
前言
参考了网站Stanford Encyclopedia of Philosophy关于囚徒困境问题(Prisoner’s Dilemma, PD)的文章 (http://plato.stanford.edu/entries/prisoner-dilemma/)中对囚徒困境问题的一个图解,引申出下文。
基本PD问题图解
一个二人博弈的囚徒困境问题,两个参与者分别为 Player1和Player2。他们之间的交往结果分为四种情况,用下面的表格体现 Player1在各种情况下的收益。
|
Action of Player2
Action of Player1
|
Cooperate(C)
|
Defect (D)
|
|
Cooperate
|
R = + 10
|
S = - 5
|
|
Defect
|
T = + 20
|
P = 0
|
之所以成其为囚徒困境问题是因为:
1. T>R and P>S, 意味着站在个人利益最大化的立场上,无论player2< font face="宋体, SimSun">选择背叛(Defect)还是合作(Cooperate),Player1都会选择背叛。
2. Symmetric, 如果Player1和Player2的情况是对称的,那么Player2也同样会选择背叛,于是两人交往最终的结果必然是相互背叛。
3. R>P, 但是,双方合作的结果要比相互背叛对于每个人都有更好的回报。
既然假设这个收益对Player1和Player2是对称的,于是我们把两个参与者在各种情况下的收益写到统一个表中
|
Action of Player2
Action of Player1
|
Cooperate(C)
|
Defect (D)
|
|
Cooperate
|
(10,10)
|
(- 5,20)
|
|
Defect
|
(20,-5)
|
(0,0)
|
用两个正交的坐标轴来分别表示两个参与者的收益,将上面表中,四种情况下双方收益的坐标绘成点,来得到下面的图。
途中坐标的确切值没有标出,但是用方括号标出了各个点所代表的不同情况。途中重要的部分是:
状态点
表明改点双方的合作情况和收益情况
状态转移过程
将状态点连接起来的线,代表状态转移的过程。可以看出红色的线代表的状态转移发生的根源是 Player1的决策变化,而蓝色的线完全是因为Player2< font face="宋体, SimSun">的决策变化。
于是用这个图来解释囚徒困境问题的形成
首先相互合作的状态[C,C]是不稳定的。从上端的蓝线来看,[C,D]点对于Player2来说收益要大于[C,C]点([C,D]比[C,C]要高),虽然这样做会让Player1损失很大,但是Player2处于自身利益最大化的原则,肯定会向[C,D]点转移。
同理Player1在相互合作的情况下也倾向于向[D,C]点转移。
在[C,D]点,Player1有主动通过左侧的红线向[D,D]点转移的能力,也有这个倾向,因为他只有这样做,才能挽回自己的损失,得到利益。同样,在 [D,C]点,Player也会将最终的状态带到相互不合作的[D,D]点。
可以看出,
囚徒困境问题的成立条件图解
首先对于两个参与者Player1,Player2< font face="宋体, SimSun">的收益矩阵并不一定要求是相互对称的。
相互合作关系无法维系的区域和互不合作现象产生的区域,分别在下面的图中表示为灰色和浅黄色的三角形。
(T1-R1)(T2-R2) >= (R1-S1)(R2-S2)
两个伙伴在沙漠里遇到了风暴,剩下的水和食物只够一个人走出沙漠了。
一个人背叛伙伴,带上所有的给养走出沙漠,这个情况下是最好的选择了,至少有一个人还活着。
另外一个人也同样渴望生存,他不甘心伙伴的背叛。两个人争执、搏斗、相互背叛,反而消耗了更多的体力,还不如平静地共享剩下的给养,多活几天。
这是非常悲惨的囚徒困境。
无产阶级的困境
这已经不是双方的困境问题了。
如下图。在双方合作的[C,C]点,由于Player1的背叛到达了[D,C]点,这使得Player2受到了损失。但是在[D,C]点,Player2却不能选择背叛,因为背叛意味着双方的状态将到达[D,D] 点,这样他会受到进一步的损失。他只能在这里“委曲求全”。
但是[C,C]点的位置决定(T1-R1)(T2-R2)≤(R1-S1)(R2-S2),于是双方的总体利益并没有达到最大值,只是 Player1剥削了Player2的利益,成为了Player2的困境了。
这种情况是在不利于Player2的前提下出现的。现实社会中这样的情况有很多。典型的资本家对无产阶级,地主对农民,都是这种困境的体现。无产阶级不拥有生产资料,当剥削阶级选择不合作,也就是剥削无产阶级得策略的时候,将使无产阶级陷入困境。无产阶级不能选择对剥削阶级的背叛,尽管这种背叛可以打击剥削阶级,但同时对他们自己的利益也是一种损失。他们只能忍受剥削。
存在剥削的社会到底是不是一个进步的社会?
如果从整体利益的最大化上来说,已经提到上面图中的[C,C] 点是整体利益最大化的点,那么这种剥削就是反动的。从这种简单的意义上来说,如果能够证明人类社会是符合上图的模式,就证明了没有剥削和压迫得共产主义是最先进的。
实际社会中这种剥削式的困境是在太多了。
所谓“店大欺客,客大欺店”,无论谁占有稀缺资源,都可以成为剥削阶级。中国电信业、铁路等等垄断行业,可以任意背叛顾客,将双方的交往拉入到一个“单赢”的境地,而顾客是没有办法逃脱这种困境的,因为没有其它的途径可以得到这些资源,顾客的背叛即意味着自己的进一步损失。
某种意义上说,政府也是掌握稀缺资源的博弈者。喊口号、树立典型、加强思想教育是没有用的。由无数个正面典型被树立起来了,大家也都看到了,老百姓知道,政府官员知道,包括犯了错误和正在犯错误的官员也知道,好好当官为民谋福对双方来说是可以达到整体利益最大化的,整个社会也会进步、发展,何乐而不为呢?
二十几年来,从小学到大学,虽然只是人生路上短短的一段,我却也看到过了数不清的“幸福生活”的图景。每次电视电影书报里看过了“人民政府爱人民,人民群众爱政府”,“万众一心。。”的大团圆的大结局,我总会莫名其妙的疑问,现实社护中为什么不是这样呢?难道腐败分子不知道他们所做的损害了大多数的老百姓和国家的利益吗?他们不知道他们的一点腐败收入和整个社会的巨大损失是无法比拟的吗?
大到卖国贼,小到收回扣的采购人员,无一例外。
我从来没有惊异过为什么小偷小摸,不讲信用的小人回长期存在,因为他们使自己和别人所陷入的仅仅是囚徒的困境,是因为他们的自私和无知。而上面这样的剥削阶级在清楚对整个社会造成的结果的情况下让无产阶级陷入困境,让整个社会陷入困境,我认为就是非常彻底的罪恶了。
革命
无产阶级的困境不会永远存在的。会有人跳出“个人利益最大化”的束缚,他们不愿意让剥削存在,他们选择了不合作,宁可牺牲自己的利益,他们使博弈从[D,C]点走到了[D,D]点。
只有一个革命者的时候,革命者会牺牲。当这样的革命者多起来之后,就会翻天覆地,也就是说这个图中所有的点都可能有新的位置,国家和人民的博弈有了变化。
至于变化后的结果是不是一个可以维持整体利益最大的先进社会,不得而知了。
高薪养廉
如下图。
如果双方合作的收益点不是[C,C],而是下图中的[C,C]’,那么Player1就不会主动背叛对Player2进行剥削了。这是高薪养廉的政策。让本份工作的人能够有最直接的收益,才能根本上杜绝权力犯罪。
也就是说,如果图中的[D,D]点代表了现实利益分配的情况,那么说明博弈中的 Player1是有相对的权力的,为了防止他对Player2的剥削从而造成的整体利益的损失,要对他的合作予以奖励,要把双方合作点移到[C,C]’的位置。
[C,C]’相对于[C,C]来说,增大了有优势一方Player1的收益,削弱了弱势一方Player2的收益,但是却防止了原本必然发生的剥削。对 Player2来说是乐意接受的,对整理利益来说也是合理的。
总体利益等值线
参考上一节的图。
[C,C]点和[C,C]’点所在的直线,和[C,D]与[D,C]点所在的直线平行。这一系列的平行线可以称为总体利益等值线。在每一条等值线上所有的点代表的博弈双方得总体利益是相同的。
上一节图中之所以把[C,C] 和[C,C]’点画在同一条等值线上,就是为了说明在社会整体利益不变的情况下,高薪养廉的政策是可行的。
两条等值线之间的距离体现了两类合作点之间的社会整体利益的差别。
等值线和[D,D]点之间的距离体现了囚徒困境中整体的损失。
等值线和[C,D],[D,C]’点所在的基准等值线之间的距离体现了剥削社会中整体利益的损失大小。实际社会中,腐败、卖国等行为造成的这个损失非常巨大,这个巨大的利益空间也就指明了高薪养廉的“高薪”还是非常有余地的。
大小猪问题
Player1是小猪,Player2是大猪。
小猪剥削大猪。
共产主义
福贵送有庆去学校参加炼钢,一路上他哄着睡意惺忪的儿子,说道:“咱们家现在是一只小鸡,鸡养大了就变成了鹅,鹅养大了就变成了羊,羊再养大了就变成牛了,牛以后就变成共产主义了……” —— 余华《活着》
如果哪一天,人们不再仅仅以物质来衡量利益,道德和内心的善良成为取舍的主要理由,也许就能达到下图这样的境界了。
或者是因为生产力发展,或者是因为道德水平的进步,背叛别人在任何人眼中都是无利益可得的,都是不可取的。大家心平气和,尽我所能,取我所需,我看共产主义就算实现了吧。
结婚
其实婚姻从来就有一种枷锁的含义在里头。马太福音中说:
They are no longer two but one flesh. Therefore what God has joined together, let not man separate. ──Matthew 19:6(既然如此,夫妻不在是两个人,乃是一体的了。所以神配合的,人不可分开。)
美满的婚姻可以保持在[C,C]点。维持夫妻都不背叛的东西是爱情,爱情使得个人利益与欲望的最大化原则不再存在。
某一方的背叛使得婚姻从[C,C]滑落,但是另一方往往选择迁就。因为如上图,双方的背叛,也就是离婚,双方得情况都会更糟。
我结婚一定会慎重。
后记
本文几乎没有参考文献,我也没有系统地读过博弈论的教材,所以唯恐和已经发表成形的理论重复。如果有,请老师指点给我,我非常想拜读一下。
文章想象多,推导少;故事多,理论少。还请老师多原谅。不过用来给初学者一点启发,给读者一点实用参考,给专家一点乐趣,还应该有点价值。
学完《认知学导论》这门课,我对博弈论产生了非常大的兴趣。“兴趣是探索的永恒动力”,所以我想这是我这门课的最大收获了。