核回归

来自testwiki
imported>InternetArchiveBot2025年2月8日 (六) 17:08的版本 (Add 1 book for verifiability (20250207)) #IABot (v2.0.9.5) (GreenC bot
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

Template:NoteTA 核回归(又称局部加权线性回归)是统计学中用于估计随机变量条件期望非参数方法。目的是找到一对随机变量XY之间的非线性关系。

在任何非参数回归中 ,变量的条件期望 Y相对于变量X可以写成:

E(Y|X)=m(X)

m为一个未知函数。

Nadaraya–Watson核回归

1964年, Nadaraya和Watson都提出了估算m作为局部加权平均值,使用内核作为加权函数的方法。 [1] [2] [3] Nadaraya–Watson估计量为:

m^h(x)=i=1nKh(xxi)yij=1nKh(xxj)

Kh是一个带宽为 h 的核。 分母是一个总和为1的加权项。

推导

E(Y|X=x)=yf(y|x)dy=yf(x,y)f(x)dy

内核密度估计用于具有内核K的联合分布f(x,y)f(x)

f^(x,y)=1ni=1nKh(xxi)Kh(yyi), f^(x)=1ni=1nKh(xxi),

我们得到

E^(Y|X=x)=yi=1nKh(xxi)Kh(yyi)j=1nKh(xxj)dy,=i=1nKh(xxi)yKh(yyi)dyj=1nKh(xxj),=i=1nKh(xxi)yij=1nKh(xxj),

这便是Nadaraya–Watson估计量。

Priestley–Chao核估计函数

m^PC(x)=h1i=2n(xixi1)K(xxih)yi

此处 h 为带宽(或平滑参数)。

Gasser–Müller核估计函数

m^GM(x)=h1i=1n[si1siK(xuh)du]yi

此处 si=xi1+xi2

示例

此示例基于加拿大截面工资数据,该数据由1971年加拿大人口普查公用带中的随机样本组成,这些样本适用于受过普通教育的男性(13年级)。共有205个观测值。

右图显示了使用二阶高斯核以及渐近变化范围的估计回归函数

程序实例

以下R语言命令使用npreg()函数提供最佳平滑效果并创建上面给出的图形。 这些命令可以通过剪切和粘贴在命令提示符下输入。

 install.packages("np")
 library(np) # non parametric library
 data(cps71)
 attach(cps71)

 m <- npreg(logwage~age)

 plot(m,plot.errors.method="asymptotic",
   plot.errors.style="band",
   ylim=c(11,15.2))

 points(age,logwage,cex=.25)

相关资料

大卫·萨尔斯堡 (David Salsburg)指出 ,用于内核回归的算法是独立开发的,并且已用于模糊系统 :“通过几乎完全相同的计算机算法,模糊系统和基于内核密度的回归似乎是完全独立于彼此而开发的。 ” [4]

统计实现

相关资料

  • 内核平滑
  • 局部回归

参考文献

Template:Reflist

延申阅读

外部链接

Template:Authority control