Glicko评分系统

来自testwiki
跳转到导航 跳转到搜索

Glicko评分系统(英文:Glicko rating system)及Glicko-2评分系统(英文:Glicko-2 rating system)是评估选手在比赛中(如国际象棋围棋)的技术能力方法之一。此方法由Template:Tsl发明,原为Template:Tsl打造,后作为等级分评分系统的改进版本广泛应用。格里克曼在此算法中的主要贡献是“评分可靠性”(Ratings Reliability,简称RD),即评分标准差(Ratings Deviation)。

Glicko与Glicko-2评分系统被发表至公有领域。诸多在线Template:Translink(如《Pokémon Showdown》、《Template:Tsl》、《Template:Tsl》、《Chess.com》、《在线围棋服务器 Template:Wayback[1]、《絕對武力:全球攻勢》、《絕地要塞2》、《刀塔霸业》、《激战2》、《Splatoon 2》及《皇舆争霸》)和多个竞技性编程比赛都采用此种评分方法。[2]Glicko所使用的算法可在其网站上找到。

算法中,评分可靠性用于测量选手的评分,一评分可靠性(评分标准差)相当于一标准差。举个例子,一名评分为1500分的选手,其评分可靠性为50,表示有95%的可能性这名选手的真实实力约在1400至1600分(1500分的两个标准差)之间。选手的实力区间需增加并减去评分中的两个评分标准差来计算。在比赛结束后,选手的实力评分的波动根据评分标准差来计算:当选手的评分标准差较低(选手的评分已较为准确)或其对手的评分标准差较高时(对手的真实实力无法确定)时,选手的评分波动也较小。评分标准差将在比赛后减小,但将在一段时间不活跃后渐渐增大。

Glicko-2是Glicko评分系统的改进版本,引进了评分挥发度σ(Rating Volatility)的概念。Template:Translink采用稍加修改版的Glicko-2评分系统。[3]

测量

下列评分流程仅适用于Glicko评分系统,不适用于Glicko-2。

若选手没有评分,则其评分通常被设为1500,评分标准差为350。

测算标准差

新的评分标准差(RD)可使用旧的评分标准差(RD0)计算:

RD=min(RD02+c2t,350)

t为自上次比赛至现在的时间长度(评分期),350则是新选手的评分标准差。若选手在一个评分期间内进行了多场比赛,此算法会将进行的比赛作为一场看待。评分期根据选手进行比赛的频繁程度,可能长至七个月,短至几分钟。常数c根据选手在特定时间段内的技术不确定性计算而来,计算方法可能通过数据分析,或是估算选手的评分标准差将在什么时候达到未评分选手的评分标准差得来。若一名选手的评分标准差将在100个评分期间内达到350的不确定度,则评分标准差为50的玩家的常数c可通过解350=502+100c2的方式计算而来。[4]

c=(3502502)/10034.6

测算新评分

在经过m场比赛后,选手的新评分可通过下列等式计算:

r=r0+q1RD2+1d2i=1mg(RDi)(siE(s|r0,ri,RDi))

其中:

g(RDi)=11+3q2(RDi2)π2

E(s|r,ri,RDi)=11+10(g(RDi)(r0ri)400)

q=ln(10)400=0.00575646273

d2=1q2i=1m(g(RDi))2E(s|r0,ri,RDi)(1E(s|r0,ri,RDi))

ri表示选手个人的评分;

si表示每场比赛后的结果。胜利为1,平局为12,失败为0。

测算新评分标准差

原先用于计算评分标准差的函数应增大标准差值,进而反应模型中一定非观察时间内,玩家的技术不确定性的增长。随后,评分标准差将在几场游戏后更新:

RD=(1RD2+1d2)1

另请参阅

参考文献

外部链接