查看“︁信号博弈”︁的源代码
←
信号博弈
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1=博弈论 |G2=Math }} {{article issues | {{Expand|time=2011-03-12T10:35:25+00:00}} {{Expert|time=2011-03-12T10:35:25+00:00}} {{Primarysources|time=2011-03-12T10:35:25+00:00}} {{Unreferenced|time=2011-03-12T10:35:25+00:00}} }} '''信號博弈'''({{lang-en|signaling game}}),是一種由一個發送者(S)和另一個接收者(R)所組成的[[動態博弈]]。一開始這個發送者有一個給定的類型(t),接著發送者會觀察這個沒有其他人(好比說接收者)知道的類型,去從訊息堆 M = {m1, m2, m3,..., mj} 中選擇送出一個訊息(m),接著接收者會觀察這個訊息後從他可行的動作中 A = {a1, a2, a3,...., ak} 選一個作為反應動作(a),這裡要注意的是接收者除了訊息之外其他都無法得知(如發送者的類型t),接著根據(t, m, a)的組合來決定雙方會獲得的報酬或回報。 == 精炼贝叶斯均衡 == 每种类型的发送者发送的消息都满足消息集合M中的概率分布,设<math>m(t_j)</math>表示<math>t_j</math>类型的发送者发送M中任意消息的概率。接收者观察到消息m后作出的反应动作<math>a^*(m)</math>也满足行动集合A中的概率分布。 精炼贝叶斯均衡需要满足下面四个条件: * 接收者知道对任意的消息m,哪些类型的发送者会发送m。也即他知道发送m的发送者属于<math>t_i</math>类型的概率<math>\mu(t_i|m)</math>,这个概率对所有类型<math>t_i</math>求和应该等于1。 * 接收者选择的行动应该按照他对上一个条件的认知<math>\mu(t_i|m)</math>最大化他的预期效用,即选择适当的行动,使得<math>\sum_{t_i} \mu(t_i|m)U_R(t_i,m,a)</math>最大化。记这个最大化预期效用的行动为<math>a^*(m)</math>。 * 根据上述条件确定的接收者策略<math>a^*</math>,对每种类型<math>t</math>,发送者选择的消息<math>m^*</math>应该最大化发送者的预期效用<math>U_S (t, m,a^*(m))</math>。 * 对发送者可能发送的每种消息<math>m</math>,如果至少存在一种类型<math>t</math>使得<math>m^*(t)</math>等于<math>m</math>的概率严格大于零(即至少存在一种类型的发送者可能会发送消息m),那么接收者收到消息<math>m</math>之后认为发送者属于t类型的后验概率<math>\mu(t|m)</math>满足[[贝叶斯定理]]:<math>\mu(t|m) = p(t)/\sum_{t_i} p(t_i)</math>。 {{博弈论}} [[Category:博弈论]]
该页面使用的模板:
Template:Article issues
(
查看源代码
)
Template:Lang-en
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:博弈论
(
查看源代码
)
返回
信号博弈
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息