殘差平方和

来自testwiki
跳转到导航 跳转到搜索

Template:Expand language 殘差平方和Template:Lang-en,縮寫:RSS)在統計學上是指將所有做預測時的誤差值平方加起來得出的數:

RSS=i=1nei2

它是衡量数据与估计模型之间差异的尺度。较小的残差平方和表示模型能良好地拟合数据。在确定参数和选择模型时,残差平方和是一种最优性准则。通常,总的方差=已经被模型解释了的平方和+残差平方和。

殘差平方和這個數值在機器學習上是普通最小二乘法演算法的重心。

与皮尔逊相关系数的关系

对于两变量x和y, 它们的数据组的均值分别记为x¯,y¯,则两数据组的皮尔逊相关系数r=SxySxxSyy,其中, Sxy=i=1n(x¯xi)(y¯yi)Sxx=i=1n(x¯xi)2Syy=i=1n(y¯yi)2.

给定最小二乘回归线方程为 y^=ax+b=f(x), 其中 b=y¯ax¯ ; a=SxySxx. 则这时残差平方和可以表示为:

RSS=i=1n(yif(xi))2=i=1n(yi(axi+b))2=i=1n(yiaxiy¯+ax¯)2=i=1n(a(x¯xi)(y¯yi))2=a2Sxx2aSxy+Syy=SyyaSxy=Syy(1Sxy2SxxSyy)

通过皮尔逊相关系数的公式,可以得到 RSS=Syy(1r2).