簡單線性迴歸

来自testwiki
imported>InternetArchiveBot2024年10月21日 (一) 17:05的版本 (补救3个来源,并将0个来源标记为失效。) #IABot (v2.0.9.5)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

Template:NoteTA

Template:迴归侧栏

奧肯法則總體經濟學是簡單線性迴歸的實例。圖中應變數(經濟增長率)被推論為與自變數(失業率變動)存在負向的線性關係。

統計學中,簡單線性迴歸是指僅具有單一的自變數線性迴歸[1][2][3][4][5],其中「簡單」係單一自變數之意。此迴歸可用於估計有限的截距斜率以推論應變數在特定自變數為條件下的均值

普通最小二乘法是常見用於尋求簡單線性迴歸式的方法,目的是得到能使殘差平方和最小的迴歸式。其它方法,諸如Template:En-link(使殘差絕對值的總和最小)、泰爾-森估算(所有樣本點兩兩配對的斜率中位數做為整體斜率)等,亦可應用於簡單線性迴歸的命題。Template:En-link(考慮自變數與應變數同時為誤差來源)的功能雖然與上述方法相似但不屬於簡單線性迴歸的範疇,因其不區分自變數與應變數且可能得到多個迴歸式。

以最小平方法處理簡單線性迴歸,則求得的斜率Template:Mvar等於自變數Template:Mvar與應變數Template:Mvar皮爾森積動差相關係數與二者的標準偏差比值的乘積,

β^=rx,ysysx

而再考慮截距Template:Mvar則保證使迴歸線通過自變數與應變數的均值 Template:Math

計算迴歸式

以下皆以普通最小二乘法求解簡單線性迴歸式。考慮以下的數學模型函數

y=α+βx

是一條斜率Template:Mvary軸截距Template:Mvar的直線。通常實際上自變數與應變數並非如此完美的關係而存在未知的誤差Template:Mvar,即

yi=α+βxi+εi,i=1,,n

以表示第i對資料中自變數與應變數的關係。此模型稱為簡單線性模型。

計算迴歸式的目標是根據資料計算估計值α^β^以「最佳地」估計參數Template:MvarTemplate:Mvar。由於採用最小平方法進行計算,「最佳」係指能使殘差平方和ε^i=yiαβxi最小的參數估計值為目標。換句話說,我們尋求能使Template:Mvar函數值最小的解,

Q(α,β)=i=1nε^i2=i=1n(yiαβxi)2

此解為α^β^[6]

α^=y¯(β^x¯),β^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2=sx,ysx2=rxysysx

其中 Template:Unordered list

α^β^帶入

y^=α^+β^x

可得

y^y¯sy=rxyxx¯sx

此式呈現了Template:Math為預先將自變數與應變數預先標準化後的迴歸斜率。由於Template:Math界於Template:MathTemplate:Math之間,左式的絕對值勢必不大於右式,體現了Template:En-link的現象。

xy表示對應的Template:MvarTemplate:Mvar的乘積和,

xy=1ni=1nxiyi

可使Template:Math簡化成

rxy=xyx¯y¯(x2x¯2)(y2y¯2)

簡單線性迴歸的判定係數即為二變數間皮爾森積動差相關係數的平方:

R2=rxy2

迴歸係數(斜率)的意義

β^的估計式分子乘以(xix¯)(xix¯),可改寫為

β^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2=i=1n((xix¯)2×(yiy¯)(xix¯))i=1n(xix¯)2

可以看出,迴歸式的斜率為(yiy¯)(xix¯)(xix¯)2為權數的加權平均。因此,(xix¯)2越大的資料對斜率β^的影響力越大。

截距的意義

α^可經由下列式子估算: α^=y¯β^ x¯。 由於β^=tan(θ)=dy/dxdy=dx×β^,其中θ即為與橫軸正值的夾角,可以得到α^=y¯dx×β^=y¯dy

參考文獻

Template:Reflist

Template:-

Template:统计学

  1. Template:Cite book
  2. Template:Cite web
  3. Template:Cite book
  4. Template:Cite journal
  5. Template:Cite journal
  6. Kenney, J. F. and Keeping, E. S. (1962) "Linear Regression and Correlation." Ch. 15 in Mathematics of Statistics, Pt. 1, 3rd ed. Princeton, NJ: Van Nostrand, pp. 252–285