查看“︁正则形式的博弈”︁的源代码
←
正则形式的博弈
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1=博弈论 }} 在[[博弈论]]中,'''正则形式'''(Normal-form game)是描述博弈的一种方式。与[[扩展形式的博弈|延展形式]]不同,正则形式不用图形来描述博弈,而是用[[矩阵]]来陈述博弈。与延展形式的表述方式相比,这种方式在识别出[[严格优势策略]]和[[纳什均衡]]上更有用,但会丢失某些信息。博弈的正则形式的表述方式包括如下部分:每个参与者所有显然的和可能的[[策略(博弈论)|策略]],以及和与其相对应的收益。 在[[完美信息|非完美信息]]的[[完全信息|完全]]静态博弈中,正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数,是从参与者策略空间的向量积到该参与者收益集合(一般是实数集,数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用)的映射。也就是说,参与者的收益函数把策略组合(所有参与者策略的清单)作为它的输入量,然后输出参与者的收益。 == 一个实例 == {| align=right border="1" cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom |''一个正则形式的博弈'' |- | ! scope="col" style="color: #900;width: 90px;"|''乙选择左'' ! scope="col" style="color: #900;width: 90px;"|''乙选择右'' |- ! scope="col" style="color: #009;width: 90px;"|''甲选择顶'' |align=center| <span style="color: #009">4</span>, <span style="color: #900">3</span> |align=center| <span style="color: #009">-1</span>, <span style="color: #900">-1</span> |- ! scope="col" style="color: #009;width: 100px;"|''甲选择底'' |align=center| <span style="color: #009">0</span>, <span style="color: #900">0</span> |align=center| <span style="color: #009">3</span>, <span style="color: #900">4</span> |} 有种博弈是参与者同时(或至少在做出行动前不观察其他参与者的动作)做出行动,并按照上述已做出行动的组合获得收益。右边的矩阵是这种博弈得正则形式的表述方式。例如,如果甲做出行动“顶”,而乙做出行动“左”,则甲得到收收益4,乙得到收益3。在每个回合,第一个数字代表排参与者(此处为甲)的收益,第二个数字代表列参与者(此处为乙)的收益。 === 其他表述方式 === [[对称博弈]](其收益不是依赖于参与者选择的动作)常常被表述为只有一种收益,即竖排参与者的收益。例如,左右两边的收益矩阵表述的是同一个博弈。 {| align="center" | {| border="1" cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ class="nowrap" align=bottom|''两个参与者都有的'' | ! ''雄鹿'' ! ''野兔'' |- ! ''雄鹿'' | 3, 3 | 0, 2 |- ! ''野兔'' | 2, 0 | 2, 2 |} | {| border="1" cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom|''只有竖排的'' | ! ''雄鹿'' ! ''野兔'' |- ! ''雄鹿'' | 3 | 0 |- ! ''野兔'' | 2 | 2 |} |} == 正则形式的使用 == === 占优策略 === {| border="1" align=right cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom|''囚徒困境'' | ! ''合作'' ! ''背叛'' |- ! ''合作'' | 2, 2 | 0, 3 |- ! ''背叛'' | 3, 0 | 1, 1 |} 收益矩阵有助于剔除[[劣势策略]],而且经常被用于说明这个概念。例如,在囚徒困境中(右图),参与者会发现因为其他人的''背叛'',''合作''成了严格劣势策略。参与者会比较每列的第一个数字,在这个例子中,3>2且1>0。这表明无论横排参与者怎样选择,竖排参与者选择''背叛''都比较好些。类似地,参与者会比较每列的第二个数字,同样也是3>2且1>0。这说明无论竖排参与者怎么做,横排参与者选择''背叛''都比较好些。这就证明了此博弈唯一的纳什均衡是(''背叛'',''背叛'')。 {{clear2|right}} === 正则形式的连续博弈 === {| align=right border="1" cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom |''一个连续博弈'' |- | ! ''左,左'' ! ''左,右'' ! ''右,左'' ! ''右,右'' |- ! ''顶'' |align=center|4, 3 |align=center|4, 3 |align=center|-1, -1 |align=center|-1, -1 |- ! ''底'' |align=center|0, 0 |align=center|3, 4 |align=center|0, 0 |align=center|3, 4 |} 这些矩阵只表述同时(或者更一般地,信息是不[[完美信息|完美]]的)做出行动的博弈。上述矩阵不能表述甲先做出行动,被乙观察到,然后乙再做出行动的博弈。因为在这个例子中,无法确定乙每次的策略。为了表述这种连续博弈,我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况,某种行动决不会出现。和前面一样,在这个博弈中乙有两种选择,''左''和''右''。与前面不一样的是,视甲的行动不同而定,乙有四种策略。这些策略是: # ''如果甲选择顶,选择左;否则,选择左'' # ''如果甲选择顶,选择左;否则,选择右'' # ''如果甲选择顶,选择右;否则,选择左'' # ''如果甲选择顶,选择右;否则,选择右'' 右图是这个博弈的正则形式的表述方式。 == 一般形式 == 为了用把博弈表述成正则形式,需要提供下列数据: * 表示参与者的有限集P,标记为{1,2,…,''m''} * 每个参与者''k''在''P''里拥有有限个[[纯策略]] <math> S_k = \{1, 2, \ldots, n_k\}. </math> 一个纯策略组合是参与者策略的联合,这是一个''m''[[元组]] <math> \vec{\sigma} = (\sigma_1, \sigma_2, \ldots,\sigma_m) </math> 则有 <math> \sigma_1 \in S_1, \sigma_2 \in S_2, \ldots, \sigma_m \in S_m </math> 我们用Σ来表示策略组合的集合 收益函数形如 <math> F: \Sigma \rightarrow \mathbb{R}. </math> 其预期解释是博弈结束时给予单个参与者的奖品。相应地,为了完整地说明一个博弈,收益函数必须在参与者集 ''P''= {1, 2, ..., ''m''}中对每个参与者详细说明。 '''定义''':一个'''正则形式的博弈'''的结构形如 <math> (P, \mathbf{S}, \mathbf{F}) </math> 这里 ''P'' = {1,2, ...,''m''}是参与者集合, <math>\mathbf{S}= (S_1, S_2, \ldots, S_m) </math> 是纯策略集合的一个m元组,每个纯策略对应于一个参与者,而 <math> \mathbf{F} = (F_1, F_2, \ldots, F_m) </math> 是收益函数的''m''元组。 没有理由在前面的讨论中,把参与者数量有限或每个参与者的策略有限的博弈排除在外。因为要用到[[泛函分析]]的技巧,关于有限博弈的研究非常艰深。 == 参考文献 == * D. Fudenberg and J. Tirole, ''Game Theory'', MIT Press, 1991. * R. D. Luce and H. Raiffa, ''Games and Decisions'', Dover Publications, 1989. * J. Weibull, ''Evolutionary Game Theory'', MIT Press, 1996 * J. von Neumann and O. Morgenstern, ''Theory of games and Economic Behavior'', John Wiley Science Editions, 1964. This book was initially published by Princeton University Press in 1944. == 外部链接 == * http://www.whalens.org/Sofia/choice/matrix.htm {{Wayback|url=http://www.whalens.org/Sofia/choice/matrix.htm |date=20190913005826 }} {{博弈论}} [[Category:博弈论]]
该页面使用的模板:
Template:Clear2
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Wayback
(
查看源代码
)
Template:博弈论
(
查看源代码
)
返回
正则形式的博弈
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息