对称博弈

来自testwiki
imported>Cewbot2022年4月29日 (五) 05:16的版本 (Robot: 修正維基語法 1: 没有加粗的条目题目)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

博弈论中,如果博弈的收益只依赖于选手所选择的策略而不依赖于进行博弈的选手,那么这类博弈就被称为对称博弈。对称博弈存在着不同的种类。例如,在囚徒困境的博弈中,囚徒都选择认罪的结果为都判刑5年,都选择不认罪的结果为都判刑1年,一个选择认罪一个不认罪的结果分别为判刑10年与释放。在这个博弈中,囚徒最终判刑的年数只要他选择认罪与否有关,而与他的身份无关,这就是一个对称博弈。用表格表示如下。

甲认罪 甲不认罪
乙认罪 5年,5年 0,10年
乙不认罪 10年,0 年 1年,1年

一般情况

对于参与者i而言,博弈的收益为Ui:A1×A2××An,其中Ai为参与者i的决策集合。如果存在A1=A2==AN,那么对于任何排列π而言该博弈为对称博弈。

Uπ(i)(a1,,ai,,aN)=Ui(aπ(1),,aπ(i),,aπ(N)).[1]

帕萨·达斯古普塔和埃里克·马斯金给出了以下定义,此后,这一定义在经济学文献中反复出现

Ui(a1,,ai,,aN)=Uπ(i)(aπ(1),,aπ(i),,aπ(N)).


参考文献

Template:Reflist Template:博弈论