博弈论的形成
冯.诺伊曼和摩根斯坦《博弈论和经济行为》
Theory of Games and Economic Behavior 1944
引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示
提出稳定集(stable sets)解概念
正式提出创造博弈论一般理论的主意
给出博弈论研究的一般框架、概念术语和表述方法
1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。
1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prison’s dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;
1952-1953年期间(L. S.Shapley)和(D. B.Gillies)提出“核”(Core)作为合作博弈的一般解概念
Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。
奥曼(R. J. Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”
1954-1955年提出了“微分博弈”(Differential games)的概念。
奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。
“重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。
1960年(Thomas C.Schelling)引进了“焦点”(Focalpoint)的概念。
博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。
塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nashequilibrium)
1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)
海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。
海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。
70年代“进化博弈论”(Evolutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”( Evolutionarily stable strategy,ESS)等。
“共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。
1981(Elon Kohlberg) “顺推归纳法”(Forward induction)
克瑞泼斯(David M. kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)
1982年斯密(John MaynardSmith)出版了《进化和博弈论》(<Evolution and the theory ofgames>)
1984年由伯恩海姆(B. D. Bernheim)和皮尔斯(D. G. Pearce)提出“可理性化性”(Rationalizability)
海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准,
1991年弗得伯格(D. Fudenberg)和泰勒尔(J.Tirole)首先提出了“完美贝叶斯均衡”(Perfext Bayesian equilibrium)的概念
1994:非合作博弈:纳什(Nash)、海萨尼(Harsanyi)、塞尔顿(Selten)
1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey)
2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场)
2002:实验经济学:史密斯(Smith),心理经济学:卡尼曼(Kahneman)
博弈就是策略对抗,或策略有关键作用的游戏
博弈论Game Theory,游戏和经济等决策竞争较量的共同特征:
规则、结果、策略选择,策略和利益相互依存
四个核心方面
博弈的参加者(Player)——博弈方
各博弈方的策略(Strategies)或行为(Actions)
博弈的次序(Order)
博弈方的得益(Payoffs)
博弈方:独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈
策略:博弈中各博弈方的选择内容
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
无限博弈:至少有某些博弈方的策略有无限多个
博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。
博弈过程对博弈结果也有重要影响。
根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。
得益:各博弈方从博弈中所获得的利益
得益对应博弈的结果,也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主要依据
根据得益的博弈分类:零和博弈、常和博弈、变和博弈
-----零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同
—猜硬币,田忌赛马,石头-剪刀-布
-----常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系
—分配固定数额的奖金、利润,遗产官司
-----变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。
—囚徒困境、产量博弈、制式问题等
博弈的信息结构
完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益
不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”
完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈
不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈
博弈方的能力和理性
----完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为的错误
有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性:一个体利益最大为目标
集体理性:追求集体利益最大化
博弈的分类和博弈理论的结构
----合作博弈:允许存在有约束力协议的博弈
非合作博弈:不允许存在有约束力协议的博弈
非合作博弈范围内:完全理性博弈和有限理性博弈(进化博弈)
静态博弈,动态博弈,重复博弈
完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,
完全但不完美信息动态博弈,不完全信息动态博弈
零和博弈和非零和博弈,单人博弈和多人博弈
完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。
上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略
上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果
上策均衡不是普遍存在的
严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。
纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果。
只有纳什均衡才具有一致预测的性质
一致预测性是纳什均衡的本质属性,一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能
古诺的寡头模型
寡头产量竞争——两厂商产量竞争
相同产品的价格竞争
假设双寡头面临的市场需求函数:
P=30-Q ;Q=Q1+Q2
假设两厂商的边际成本为:MC1=MC2=3
古诺均衡: Q1=Q2 =9P=12利润各为81
假设这两个双寡头是通过同时选择价格相互竞争。
纳什均衡就是完全竞争的均衡: P1=P2 =3=MC
Q1=Q2=13.5利润为0
差别产品的价格竞争
假设两厂商的固定成本为都为20,但没有可变成本。假设双寡头面临的市场需求函数:
厂商1的需求: Q1=12-2P1+P2
厂商2的需求: Q2=12-2P2+P1
厂商1的反应函数: P1=3+0.25P2
厂商2的反应函数: P2=3+0.25P1
纳什均衡: P1=P2 =4利润各为12
在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。
即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。
纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。
(1)任何博弈方都不会采用任何严格下策,不管它们是纯策略还是混合策略;
(2)严格下策反复消去法不会消去任何纳什均衡,包括纯策略纳什均衡和混合策略纳什均衡;
(3)如果经过反复消去后留下的策略组合是唯一的,那么一定是纳什均衡。
多重纳什均衡博弈
一、帕累托上策均衡
(鹰鸽博弈)
这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然
后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。
二、风险上策均衡
考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。
三、聚点均衡
利用博弈设定以外的信息和依据选择的均衡
文化、习惯或者其他各种特征都可能是聚点均衡的依据
城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子
四、相关均衡
防共谋均衡
如果一个博弈的某个策略组合满足下列要求:
(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;
(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;
(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。
称为“防共谋均衡”。