每天学点博弈论全集

2018-03-21
字体:
浏览:
文章简介:博弈论也叫"对策论"."赛局理论",属应用数学的一个分支,目前在生物学,经济学,国际关系,计算机科学,政治学,军事战略和其他很多学科都有广泛的应用.主要研究公式化了的激励结构间的相互作用.是研究具有斗争或竞争性质现象的数学理论和方法.也是运筹学的一个重要学科.博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略.什么是博弈?从"囚徒困境"说起博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并

博弈论也叫“对策论”、“赛局理论”,属应用数学的一个分支,目前在生物学,经济学,国际关系,计算机科学,政治学,军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

什么是博弈?从“囚徒困境”说起

博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就不可避免地要面对各种矛盾和冲突。

囚徒困境是一种非合作博弈,它的主旨为,囚徒们虽然彼此合作,坚决不吐实情,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,出卖同伙可为自己带来利益(缩短刑期),而被同伙招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人的最佳选择并非是团体的最佳选择。

1950年,就职于兰德公司的梅里尔弗勒德和梅尔文德雷希尔拟定出相关困境的理论,后来由顾问艾伯特塔克以“囚徒”方式阐述,并命名为“囚徒困境”。那么,囚徒困境的案例究竟是怎样的呢?

警方破获了一起纵火案,抓住了两名嫌疑犯甲和乙,但是没有足够的直接证据来指控二人入罪。于是,警方分开囚禁两名嫌疑人,分别对他们进行了讯问。为了瓦解分化对方,警方分别对两名嫌疑人说:如果主动坦白,可以减轻处罚;如果顽抗到底,一旦同伙招供,就要受到严惩。

如果两人都拒不坦白,那最后警方会以扰乱社会治安、破坏公共安全的罪名将二人各判刑1年;如果其中一人认罪并作证检控对方,此人将作为证人而免于起诉,而保持沉默的另一人将被重判15年;如果两人都招供,则两人都会因纵火罪被各判10年。

面对这样的情况,甲乙两名嫌疑犯在各自的心里打起了小算盘。甲经过权衡后发现,只有自己招供是最佳的选择,可以获得自由;乙也发现,无论甲招不招供,自己的最佳选择都是招供。所以,最后的结果是,甲乙二人都分别向警方坦白了自己的罪行,甲乙两个自认为聪明的人分别被判刑10年。

如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

从这个角度出发,上面故事中的两名嫌疑犯自然会选择刑期最短的策略。而由于两名囚徒隔绝监禁,并不知道对方的最终的决策;即使他们能交谈,也未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得的刑期,总比自己沉默要来得低。二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛,结果二人同样获刑10年。

因为双方都认为选择背叛自己最得利,所以根本不会去顾及团体利益。而以全体利益而言,如果两个人都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑10年的情况更好。但根据以上的假设,二人均为理性的个人,且只追求自己的个人利益。均衡状况会使两个囚徒都选择背叛,结果二人获刑均比合作要高,总体利益较合作为低。这就是“困境”所在。在日常生活中,有很多这样的“困境”存在。

有一则三个老鼠偷油的寓言故事:

三只老鼠一同去偷油喝。到了油缸边一看:油缸里的油只有那么一点点,并且缸身太高,谁也喝不到。

于是它们想出办法,一个咬着另一个的尾巴,吊下去喝。第一只喝饱了,上来,再吊第二只下去喝……并且发誓,谁也不许存半点私心。