Share to: share facebook share twitter share wa share telegram print page

 

博弈论

賽局理論(英語:Game Theory),又譯為对策论赛局理论,是经济学的一个分支,1944年馮·諾伊曼奥斯卡·摩根斯特恩合著《博弈論與經濟行為》,標誌著現代系統博弈理論的初步形成,因此他們被稱為「博弈論之父」。博弈論被認為是20世紀經濟學最偉大的成果之一。目前可以應用在生物学经济学国际关系计算机科学政治学军事战略,研究游戏或者博弈內的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。也是運籌學的一个重要学科。 現代的賽局理論的源頭是約翰·馮·諾伊曼對於雙人零和賽局的混合策略均衡點的發想和證明。

概述

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以它们是同一个游戏的特例。其中一個有名有趣的應用例子是囚徒困境

具有竞争或对抗性质的行为称为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

生物学家使用博弈理论来理解和预测演化(论)的某些结果。例如,John Maynard Smith和George R. Price在1973年发表于《自然》杂志上的论文中提出的「进化稳定对策」的这个概念就是使用了博弈理论。还可以参见演化博弈理论和行为生态学(behavioral ecology)。

博弈论也应用于数学的其他分支,如概率统计线性规划等。

数学定义

对于“博弈”有不少可以互换的定义。这里给出简短的介绍和相互关系的说明。

范式博弈

范式博弈又被译为正則形式的博弈、策略型賽局或標準型賽局。

设定是一个「參與者」(players)的集合。对于每一个「參與者」都有一个给定的“策略”集合博弈(游戏)是一个函数,定义为:

也就是说,如果我们知道了参与者的策略集合是什么,那么就可以有一个实数值与之对应。我们可以把上面的方程拆成两个方程来进一步把它一般化。一个方程是正則形式(Normal form game)的参与者方程,描述策略规定结果的方式。另外一个方程描写参与者对于结果(outcome)集合的偏好(preference)。也就是:

这里是游戏(博弈)的结果集合(outcome set)。对于每一个参与者都有一个偏好函数preference function

展开形式的博弈

展开形式的博弈又可译为擴展形式的博弈、擴展式賽局或擴展型賽局。

正则形式的定义为数学家们提供了“均衡”(equilibria)问题的研究一个容易使用的表达式。因为它避免了怎么计算“策略”的问题,也就是说游戏是怎么进行的问题。

若要考慮遊戲是如何進行的,展开形式的博弈是一个比较方便的表达式。这个形式与组合博弈论关系密切。这个定义通过一个的形式给定。在树的每一个节点(vertex),不同的参与者选择一个边(edge)。

博弈论简史

对于博弈论的研究开始于恩斯特·策梅洛(1913)、埃米尔·博雷尔(1921)及冯·诺伊曼(1928),后来由冯·诺伊曼奥斯卡·摩根斯坦(1944,1947)首次將其系统化和形式化(参照Myerson, 1991)。随后约翰·福布斯·纳什(1950,1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

约翰·福布斯·纳什约翰·海萨尼萊因哈德·澤爾騰因为他们对博弈论的突出贡献而获得1994年的瑞典銀行經濟學獎罗伯特·约翰·奥曼肯·宾摩尔戴维·克瑞普斯英语David M. Kreps阿里尔·鲁宾斯坦對於博弈论也做出重大貢獻。

博弈分类

博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:「囚徒困境」就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡子博弈精炼纳什均衡英语subgame perfect Nash equilibrium贝叶斯纳什均衡、精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。

博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

博弈论相关概念

参考书目

  1. Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0-691-01193-1
  2. Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
  3. Osborne, M. and A. Rubinstein,1994,A Course in Game Theory, Cambridge and London: The MIT Press.
  4. 岡田章,1996,『ゲーム理論』東京:有斐閣 ISBN 4-641-06794-5
  5. 金子守 『ゲーム理論と蒟蒻問答』 日本評論社、2003年4月。 ISBN 4-535-55288-6
  6. 川西諭 『ゲーム理論の思考法』 中経出版、2009年9月。 ISBN 978-4-8061-3470-1
  7. Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0-465-02121-2
  8. Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0-691-01567-8
  9. Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0-393-97421-9
  10. Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3-492-02151-4
  11. Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0-415-25095-1
  12. Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0-521-81462-6
  13. Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3-528-03214-6

外部链接

Kembali kehalaman sebelumnya


Index: pl ar de en es fr it arz nl ja pt ceb sv uk vi war zh ru af ast az bg zh-min-nan bn be ca cs cy da et el eo eu fa gl ko hi hr id he ka la lv lt hu mk ms min no nn ce uz kk ro simple sk sl sr sh fi ta tt th tg azb tr ur zh-yue hy my ace als am an hyw ban bjn map-bms ba be-tarask bcl bpy bar bs br cv nv eml hif fo fy ga gd gu hak ha hsb io ig ilo ia ie os is jv kn ht ku ckb ky mrj lb lij li lmo mai mg ml zh-classical mr xmf mzn cdo mn nap new ne frr oc mhr or as pa pnb ps pms nds crh qu sa sah sco sq scn si sd szl su sw tl shn te bug vec vo wa wuu yi yo diq bat-smg zu lad kbd ang smn ab roa-rup frp arc gn av ay bh bi bo bxr cbk-zam co za dag ary se pdc dv dsb myv ext fur gv gag inh ki glk gan guw xal haw rw kbp pam csb kw km kv koi kg gom ks gcr lo lbe ltg lez nia ln jbo lg mt mi tw mwl mdf mnw nqo fj nah na nds-nl nrm nov om pi pag pap pfl pcd krc kaa ksh rm rue sm sat sc trv stq nso sn cu so srn kab roa-tara tet tpi to chr tum tk tyv udm ug vep fiu-vro vls wo xh zea ty ak bm ch ny ee ff got iu ik kl mad cr pih ami pwn pnt dz rmy rn sg st tn ss ti din chy ts kcg ve 
Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9