查看“︁监督学习”︁的源代码

{{NoteTA
|G1=IT
|G2=Math
}}

{{refimprove|time=2014-01-18T11:53:53+00:00}}
{{机器学习导航栏}}

'''監督學習'''（{{lang-en|Supervised learning}}），又叫有监督学习，监督式学习，是[[機器學習]]的一種方法，可以由訓練資料中學到或建立一個模式（函數 / learning model），並依此模式推測新的实例。<ref>Stuart J. Russell, Peter Norvig (2010) ''[[Artificial Intelligence: A Modern Approach]], Third Edition'', Prentice Hall {{ISBN|9780136042594}}.</ref>[[訓練資料]]是由輸入物件（通常是向量）和預期輸出所組成。函數的輸出可以是一個連續的值（稱為[[迴歸分析]]），或是預測一個分類標籤（稱作[[分類]]）。

一個監督式學習者的任務在觀察完一些事先標記過的訓練範例（輸入和預期輸出）後，去預測這個函數對任何可能出現的輸入的输出。要達到此目的，學習者必須以"合理"（見[[歸納偏向]]）的方式從現有的資料中一般化到非觀察到的情況。在人類和動物感知中，則通常被稱為[[概念學習]]（concept learning）。

== 回顧 ==
監督式學習有兩種形態的模型。最一般的，監督式學習產生一個全域模型，會將輸入物件對應到預期輸出。而另一種，則是將這種對應實作在一個區域模型。（如[[案例推論]]及[[最近鄰居法]]）。為了解決一個給定的監督式學習的問題（[[手写识别|手寫辨識]]），必須考慮以下步驟：

#決定訓練資料的範例的形態。在做其它事前，工程師應決定要使用哪種資料為範例。譬如，可能是一個手寫字符，或一整個手寫的辭彙，或一行手寫文字。
#搜集訓練資料。這資料須要具有真實世界的特徵。所以，可以由人類專家或（機器或感測器的）測量中得到輸入物件和其相對應輸出。
#決定學習函數的輸入特徵的表示法。學習函數的準確度與輸入的物件如何表示是有很大的關聯度。傳統上，輸入的物件會被轉成一個特徵向量，包含了許多關於描述物件的特徵。因為[[维数灾难]]的關係，特徵的個數不宜太多，但也要足夠大，才能準確的預測輸出。
#決定要學習的函數和其對應的學習演算法所使用的資料結構。譬如，工程師可能選擇[[人工神經網路]]和[[決策樹]]。
#完成設計。工程師接著在搜集到的資料上跑學習演算法。可以藉由將資料跑在資料的子集（稱為''驗證集''）或[[交叉驗證]]（cross-validation）上來調整學習演算法的參數。參數調整後，演算法可以運行在不同於訓練集的測試集上

另外對於監督式學習所使用的辭彙則是分類。現著有著各式的分類器，各自都有強項或弱項。分類器的表現很大程度上地跟要被分類的資料特性有關。並沒有某一單一分類器可以在所有給定的問題上都表現最好，這被稱為‘天下沒有白吃的午餐理論’。各式的經驗法則被用來比較分類器的表現及尋找會決定分類器表現的資料特性。決定適合某一問題的分類器仍舊是一項藝術，而非科學。

目前最廣泛被使用的分類器有[[人工神經網路]]、[[支持向量機]]、[[最近鄰居法]]、[[高斯混合模型]]、[[朴素贝叶斯分类器|朴素贝叶斯方法]]、[[決策樹]]和[[径向基函数分类]]。

== 經驗風險最小化 ==
監督式學習的目標是在給定一個 (''x'', ''g''（''x''）)的集合下，去找一個函數''g''。

假設符合''g''行為的樣本集合是從某個更大甚至是無限的母體中，根據某種未知的[[概率分布]]''p''，以[[独立同分布随机变量]]方式來取樣。則可以假設存在某個跟任務相關的[[损失函数]] ''L''

:<math>L: Y\times Y \to \mathbb{R}^+</math>

其中，''Y''是''g''的[[陪域]]，且''L''會對應到非負[[實數]]（''L''可能有其它限制）。如果預測出來''g''的值是''z''，但實際值是''y''，而''L''(''z'', ''y'')這個量是其間的''損失''。

某個函數''f''的風險是定義成损失函数的[[期望值]]。如果機率分佈p是離散的（如果是連續的，則可採用[[定積分]]和[[機率密度函數]]），則定義如下：

:<math>R(f) = \sum_i L(f(x_i), g(x_i)) \; p(x_i)</math>

現在的目標則是在一堆可能的函數中去找函數''f''<sup>*</sup>，使其風險''R''(''f''<sup>*</sup>)是[[最優化|最小]]的。

然而，既然''g''的行為已知適用於此有限集合(''x''<sub>1</sub>,&nbsp;''y''<sub>1</sub>), ..., ''x''<sub>n</sub>,&nbsp;''y''<sub>n</sub>)，則我們可以求得出真實風險的近似值，譬如，其''經驗風險''為：

:<math>\tilde{R}_n(f) = \frac{1}{n} \sum_{i=1}^n L(f(x_i), y_i)</math>

選擇會最小化經驗風險的函數''f''<sup>*</sup>就是一般所知的''經驗風險最小化''原則。統計學習理論則是研究在什麼條件下經驗風險最小化才是可行的，且預斯其近似值將能多好？

== 主動式學習 ==
一個情況是，有大量尚未標示的資料，但去標示資料則是很耗成本的。一種方法則是，學習演算法會主動去向使用者或老師去詢問標籤。
這種形態的監督式學習稱為主動式學習。既然學習者可以選擇例子，學習中要使用到的例子個數通常會比一般的監督式學習來得少。
以這種策略則有一個風險是，演算法可能會專注在於一些不重要或不合法的例子。

== 策略和演算法 ==
* [[人工神經網路]]
* [[案例推论]]
* [[決策樹]]學習
* [[最近鄰居法]]
* [[支持向量機]]
* [[隨機森林]]
* [[學習自動機]]

== 應用 ==
* [[生物資訊學]]
* [[化学信息学|化學資訊學]]
**[[定量構效關係]]
* [[手写识别|手寫辨識]]
* [[資訊檢索]]
* [[電腦視覺]]中的物件識別
* [[光學字元識別]]
* [[垃圾郵件|偵測垃圾郵件]]
* [[模式識別]]
* [[語音識別]]
* [[预测虚假财务报告]]

== 常見議題 ==
* [[計算學習理論]]
* [[歸納偏向]]
* [[過適]]現象
* {{link-en|变形空间|Version space}}

== 參考文獻 ==
{{reflist}}

== 外部連結 ==
*[https://web.archive.org/web/20110830053048/http://sumo.intec.ugent.be/?q=SUMO_toolbox Matlab '''SU'''rrogate '''MO'''deling Toolbox - SUMO Toolbox] - Matlab code for Active Learning + Model Selection + Supervised Learning (Surrogate Modeling)

{{-}}
{{Computer Science}}

[[Category:機器學習]]