中奖了,PS2

今年的人品没有像去年那样渣,在尾牙上终于没有空手而归。不然落入30%的那个垂头丧气的部分,真挺没面子的。而且连续两年空爪回家,也容易引起有关领导的怀疑,私下隐瞒窝藏的罪过可大了。今年中了个Sony PS2,是个游戏机。当我用短信第一时间报告给有关领导的时候,她给了我明确的批示:“立即找人换成1000块的超市购物券”。简直是天不随人愿,如谁愿啊,今年没有超市购物券这种奖品,取而代之的是洗脚器和电磁炉,遂作罢。

很久很久以前,可能有二十年了吧。那个时候我做梦都想有一台游戏机,就是任天堂红白机那种。家里一个表哥一个表弟都有这样的游戏机,我要看他们的脸色才能玩上一会,受到刁难是经常的。有什么游戏很好玩记不得了,能记住的只剩下那种屈辱的感觉。很多屈辱的确是因为欲望而产生的。不过对于小孩来说,让他受到委屈,让他知道有的东西无论多么想要也不可能得到,会为形成健全的人格有很大好处。

SPAM site hosted by Google Docs

自由、免费是否即意味着滥用?自由不受管制的资源可以放大邪恶的力量,绝对的自由化能产生灾难。

google.docs.host.spam

囚徒困境问题图解及变形

2003年上赵南元老师的认知科学导论这门课的时候,写的课程论文。因为蛋扯得比较圆,得了一个不错的成绩。是大学期间分数最高的一门课。

当我写“我结婚一定会慎重”这句话的时候,肯定没想到婚姻离自己已经很近了。


囚徒困境问题图解及变形

December 31, 2003

前言

参考了网站Stanford Encyclopedia of Philosophy关于囚徒困境问题(Prisoner’s Dilemma, PD)的文章 (http://plato.stanford.edu/entries/prisoner-dilemma/)中对囚徒困境问题的一个图解,引申出下文。

基本PD问题图解

一个二人博弈的囚徒困境问题,两个参与者分别为 Player1Player2。他们之间的交往结果分为四种情况,用下面的表格体现 Player1在各种情况下的收益。


Action of Player2



Action of Player1

Cooperate(C)

Defect (D)

Cooperate

R = + 10

S = - 5

Defect

T = + 20

P = 0

之所以成其为囚徒困境问题是因为:

1. T>R and P>S, 意味着站在个人利益最大化的立场上,无论player2< font face="宋体, SimSun">选择背叛(Defect)还是合作(Cooperate)Player1都会选择背叛。

2. Symmetric, 如果Player1Player2的情况是对称的,那么Player2也同样会选择背叛,于是两人交往最终的结果必然是相互背叛。

3. R>P, 但是,双方合作的结果要比相互背叛对于每个人都有更好的回报。

既然假设这个收益对Player1Player2是对称的,于是我们把两个参与者在各种情况下的收益写到统一个表中






Action of Player2



Action of Player1

Cooperate(C)

Defect (D)

Cooperate

(10,10)

(- 5,20)

Defect

(20,-5) 

(0,0)

用两个正交的坐标轴来分别表示两个参与者的收益,将上面表中,四种情况下双方收益的坐标绘成点,来得到下面的图。

途中坐标的确切值没有标出,但是用方括号标出了各个点所代表的不同情况。途中重要的部分是:

状态点
表明改点双方的合作情况和收益情况

状态转移过程
将状态点连接起来的线,代表状态转移的过程。可以看出红色的线代表的状态转移发生的根源是 Player1的决策变化,而蓝色的线完全是因为Player2< font face="宋体, SimSun">的决策变化。

于是用这个图来解释囚徒困境问题的形成

首先相互合作的状态[C,C]是不稳定的。从上端的蓝线来看,[C,D]点对于Player2来说收益要大于[C,C]点([C,D][C,C]要高),虽然这样做会让Player1损失很大,但是Player2处于自身利益最大化的原则,肯定会向[C,D]点转移。

同理Player1在相互合作的情况下也倾向于向[D,C]点转移。

[C,D]点,Player1有主动通过左侧的红线向[D,D]点转移的能力,也有这个倾向,因为他只有这样做,才能挽回自己的损失,得到利益。同样,在 [D,C]点,Player也会将最终的状态带到相互不合作的[D,D]点。

可以看出,

囚徒困境问题的成立条件图解

首先对于两个参与者Player1,Player2< font face="宋体, SimSun">的收益矩阵并不一定要求是相互对称的。

相互合作关系无法维系的区域和互不合作现象产生的区域,分别在下面的图中表示为灰色和浅黄色的三角形。

(T1-R1)(T2-R2) >= (R1-S1)(R2-S2)

两个伙伴在沙漠里遇到了风暴,剩下的水和食物只够一个人走出沙漠了。

一个人背叛伙伴,带上所有的给养走出沙漠,这个情况下是最好的选择了,至少有一个人还活着。

另外一个人也同样渴望生存,他不甘心伙伴的背叛。两个人争执、搏斗、相互背叛,反而消耗了更多的体力,还不如平静地共享剩下的给养,多活几天。

这是非常悲惨的囚徒困境。

无产阶级的困境

这已经不是双方的困境问题了。

如下图。在双方合作的[C,C]点,由于Player1的背叛到达了[D,C]点,这使得Player2受到了损失。但是在[D,C]点,Player2却不能选择背叛,因为背叛意味着双方的状态将到达[D,D] 点,这样他会受到进一步的损失。他只能在这里“委曲求全”。

但是[C,C]点的位置决定(T1-R1)(T2-R2)≤(R1-S1)(R2-S2),于是双方的总体利益并没有达到最大值,只是 Player1剥削了Player2的利益,成为了Player2的困境了。

这种情况是在不利于Player2的前提下出现的。现实社会中这样的情况有很多。典型的资本家对无产阶级,地主对农民,都是这种困境的体现。无产阶级不拥有生产资料,当剥削阶级选择不合作,也就是剥削无产阶级得策略的时候,将使无产阶级陷入困境。无产阶级不能选择对剥削阶级的背叛,尽管这种背叛可以打击剥削阶级,但同时对他们自己的利益也是一种损失。他们只能忍受剥削。

存在剥削的社会到底是不是一个进步的社会?

如果从整体利益的最大化上来说,已经提到上面图中的[C,C] 点是整体利益最大化的点,那么这种剥削就是反动的。从这种简单的意义上来说,如果能够证明人类社会是符合上图的模式,就证明了没有剥削和压迫得共产主义是最先进的。

实际社会中这种剥削式的困境是在太多了。

所谓“店大欺客,客大欺店”,无论谁占有稀缺资源,都可以成为剥削阶级。中国电信业、铁路等等垄断行业,可以任意背叛顾客,将双方的交往拉入到一个“单赢”的境地,而顾客是没有办法逃脱这种困境的,因为没有其它的途径可以得到这些资源,顾客的背叛即意味着自己的进一步损失。

某种意义上说,政府也是掌握稀缺资源的博弈者。喊口号、树立典型、加强思想教育是没有用的。由无数个正面典型被树立起来了,大家也都看到了,老百姓知道,政府官员知道,包括犯了错误和正在犯错误的官员也知道,好好当官为民谋福对双方来说是可以达到整体利益最大化的,整个社会也会进步、发展,何乐而不为呢?

二十几年来,从小学到大学,虽然只是人生路上短短的一段,我却也看到过了数不清的“幸福生活”的图景。每次电视电影书报里看过了“人民政府爱人民,人民群众爱政府”,“万众一心。。”的大团圆的大结局,我总会莫名其妙的疑问,现实社护中为什么不是这样呢?难道腐败分子不知道他们所做的损害了大多数的老百姓和国家的利益吗?他们不知道他们的一点腐败收入和整个社会的巨大损失是无法比拟的吗?

大到卖国贼,小到收回扣的采购人员,无一例外。

我从来没有惊异过为什么小偷小摸,不讲信用的小人回长期存在,因为他们使自己和别人所陷入的仅仅是囚徒的困境,是因为他们的自私和无知。而上面这样的剥削阶级在清楚对整个社会造成的结果的情况下让无产阶级陷入困境,让整个社会陷入困境,我认为就是非常彻底的罪恶了。

革命

无产阶级的困境不会永远存在的。会有人跳出“个人利益最大化”的束缚,他们不愿意让剥削存在,他们选择了不合作,宁可牺牲自己的利益,他们使博弈从[D,C]点走到了[D,D]点。

只有一个革命者的时候,革命者会牺牲。当这样的革命者多起来之后,就会翻天覆地,也就是说这个图中所有的点都可能有新的位置,国家和人民的博弈有了变化。

至于变化后的结果是不是一个可以维持整体利益最大的先进社会,不得而知了。

高薪养廉

如下图。

如果双方合作的收益点不是[C,C],而是下图中的[C,C]’,那么Player1就不会主动背叛对Player2进行剥削了。这是高薪养廉的政策。让本份工作的人能够有最直接的收益,才能根本上杜绝权力犯罪。

也就是说,如果图中的[D,D]点代表了现实利益分配的情况,那么说明博弈中的 Player1是有相对的权力的,为了防止他对Player2的剥削从而造成的整体利益的损失,要对他的合作予以奖励,要把双方合作点移到[C,C]’的位置。

[C,C]’相对于[C,C]来说,增大了有优势一方Player1的收益,削弱了弱势一方Player2的收益,但是却防止了原本必然发生的剥削。对 Player2来说是乐意接受的,对整理利益来说也是合理的。

总体利益等值线

参考上一节的图。

[C,C]点和[C,C]’点所在的直线,和[C,D][D,C]点所在的直线平行。这一系列的平行线可以称为总体利益等值线。在每一条等值线上所有的点代表的博弈双方得总体利益是相同的。

上一节图中之所以把[C,C] [C,C]’点画在同一条等值线上,就是为了说明在社会整体利益不变的情况下,高薪养廉的政策是可行的。

两条等值线之间的距离体现了两类合作点之间的社会整体利益的差别。

等值线和[D,D]点之间的距离体现了囚徒困境中整体的损失。

等值线和[C,D][D,C]’点所在的基准等值线之间的距离体现了剥削社会中整体利益的损失大小。实际社会中,腐败、卖国等行为造成的这个损失非常巨大,这个巨大的利益空间也就指明了高薪养廉的“高薪”还是非常有余地的。

大小猪问题

Player1是小猪,Player2是大猪。

小猪剥削大猪。

共产主义

福贵送有庆去学校参加炼钢,一路上他哄着睡意惺忪的儿子,说道:“咱们家现在是一只小鸡,鸡养大了就变成了鹅,鹅养大了就变成了羊,羊再养大了就变成牛了,牛以后就变成共产主义了……” —— 余华《活着》

如果哪一天,人们不再仅仅以物质来衡量利益,道德和内心的善良成为取舍的主要理由,也许就能达到下图这样的境界了。

或者是因为生产力发展,或者是因为道德水平的进步,背叛别人在任何人眼中都是无利益可得的,都是不可取的。大家心平气和,尽我所能,取我所需,我看共产主义就算实现了吧。

结婚

其实婚姻从来就有一种枷锁的含义在里头。马太福音中说:

They are no longer two but one flesh. Therefore what God has joined together, let not man separate. ──Matthew 19:6(既然如此,夫妻不在是两个人,乃是一体的了。所以神配合的,人不可分开。)

美满的婚姻可以保持在[C,C]点。维持夫妻都不背叛的东西是爱情,爱情使得个人利益与欲望的最大化原则不再存在。

某一方的背叛使得婚姻从[C,C]滑落,但是另一方往往选择迁就。因为如上图,双方的背叛,也就是离婚,双方得情况都会更糟。

我结婚一定会慎重。

后记

本文几乎没有参考文献,我也没有系统地读过博弈论的教材,所以唯恐和已经发表成形的理论重复。如果有,请老师指点给我,我非常想拜读一下。

文章想象多,推导少;故事多,理论少。还请老师多原谅。不过用来给初学者一点启发,给读者一点实用参考,给专家一点乐趣,还应该有点价值。

学完《认知学导论》这门课,我对博弈论产生了非常大的兴趣。“兴趣是探索的永恒动力”,所以我想这是我这门课的最大收获了。

读一段论语

子曰:“必也正名乎!”
子路曰:“有是哉,子之迂也!奚其正?”
子曰:“野哉,由也!君子于其所不知,盖阙如也。名不正,则言不顺;言不顺,则事不成;事不成,则礼乐不兴;礼乐不兴,则刑罚不中;刑罚不中,则民无所错手足。故君子名之必可言也,言之必可行也。君子于其言,无所苟而已矣。”

我大致上这么理解:

作人做事要讲究一个名分,有个明确的宗旨。不然的话,就说不清楚到底要干什么,当然也说不清楚要怎么做。尤其遇到障碍,自己的内心或者合作的伙伴之间产生矛盾分歧的时候,就更没法想清楚。然后做事情就不容易办好。总是感觉窝窝囊囊的比较失败,在道德上就迷糊了,不知好赖。原则、纪律,权力和义务,奖惩的制度都会因为没有指导的纲领,涣散了。如果是一个集体,里面的人就会混日子或者很盲目的做事情。其中的君子很快就会觉悟,这样一个环境,不管怎么舒适,不管有多好的回报,他都不愿意留下。因为天亮得时候,会愧对第一缕阳光;工作到很晚的时候,会疲倦但却不知在朝哪走,只能看清脚下的路而恐惧。手足无措,郁闷。做很多的事,却是在荒废岁月。

君子要言之有物,要言行和一。没事不要叨哔叨哔扯个没完,脑袋里面曾经有过的志向不能越来越模糊,而是要表达出来,让它清晰,让它具体,可以立即开始实现。做一件事情也是一样,一定先清晰说出来到底要做的是什么,按照自己说的办。别一脑瓜子扎进去迷了迷糊的瞎整。

我理解“礼乐”就是道德的取向;“刑罚”是规章、奖惩、责权、法律。孔子先说道德,再说法律,说道德要是都败坏了,法律也会行不通这样的因果关系。我很赞成。所以“八荣八耻”这样的意识形态以外的非政治纲领,我觉得比那些写进宪法写进x章的东西好得都不知道哪里去了。

贱人的逻辑

倾情奉上小白婚纱照。

351530721_4d89e1423d_b 351535071_09451388dc_b 351535074_1d65b8cfe3_b 351563185_eeabfe5894_b

小白想把婚纱照给大家看,于是我推荐flickr给他用。可是他设成private,其他人看不到。推三阻四原来是想让我通过八卦圈宣传出去。为他为啥这么费劲,曰:

自己贴出去是芙蓉姐姐,别人帮着贴出去是天仙妹妹。

贱人的逻辑。

今天好像正是小贱人的生日。生日快乐!夫妻恩爱!

同是底层的人

昨天晚上回家很晚,心情就不是很好。刚上出租车,司机师傅就开始发牢骚,说非常不高兴拉我这样一个“破活”。话里话外言下之义,他很不爽,没把我赶下去是算是他照顾我。我也一样是不爽不知道哪里去发泄,于是就跟他抬杠。我心里明白,无论如何,他也不可能让我下车。就算他失去理智,我攒了这一百八十斤也算派上用场了。

抬杠的之所以有快感完全是因为让对方感到了不爽。昨天我基本达到目的了。

不过今天看了个文章,不由得惭愧自己的涵养还是太不够,不懂得理解包容。文章是:北京十万的哥为份儿钱奔命 “我们是公司赚钱机器”

虽然自己的日子比出租司机好很多,不过和他们归根结底还是一类的人,底层的人。工作勤劳辛苦、按规矩交税交份钱、不能公平的享受公共资源。这些人,可以因为自己凭辛劳吃饭而感到自豪,同时也经常对自己身上的不公平而愤愤不满。

相濡以沫,不若相忘于江湖。

感冒了

牛B吹得太多,终于也感冒了。这个感觉可谓欲仙欲死啊。
不过还是坚持不吃药,以保金身不坏。估计三天内能恢复吧。

Random posts

  • Structure searching supported compound database based on MS Access
  • 结婚照
  • 有道理
  • Solution for Matlab 7.0 R14 on XP Pro Start up Corruption
  • 陈进欺骗了鉴定专家、上海交大、研究团队、地方政府和中央有关部委