监督学习
監督學習(英語:Supervised learning),又叫有监督学习,监督式学习,是機器學習的一種方法,可以由訓練資料中學到或建立一個模式(函數 / learning model),並依此模式推測新的实例。[1]訓練資料是由輸入物件(通常是向量)和預期輸出所組成。函數的輸出可以是一個連續的值(稱為迴歸分析),或是預測一個分類標籤(稱作分類)。 一個監督式學習者的任務在觀察完一些事先標記過的訓練範例(輸入和預期輸出)後,去預測這個函數對任何可能出現的輸入的输出。要達到此目的,學習者必須以"合理"(見歸納偏向)的方式從現有的資料中一般化到非觀察到的情況。在人類和動物感知中,則通常被稱為概念學習(concept learning)。 回顧監督式學習有兩種形態的模型。最一般的,監督式學習產生一個全域模型,會將輸入物件對應到預期輸出。而另一種,則是將這種對應實作在一個區域模型。(如案例推論及最近鄰居法)。為了解決一個給定的監督式學習的問題(手寫辨識),必須考慮以下步驟:
另外對於監督式學習所使用的辭彙則是分類。現著有著各式的分類器,各自都有強項或弱項。分類器的表現很大程度上地跟要被分類的資料特性有關。並沒有某一單一分類器可以在所有給定的問題上都表現最好,這被稱為‘天下沒有白吃的午餐理論’。各式的經驗法則被用來比較分類器的表現及尋找會決定分類器表現的資料特性。決定適合某一問題的分類器仍舊是一項藝術,而非科學。 目前最廣泛被使用的分類器有人工神經網路、支持向量機、最近鄰居法、高斯混合模型、朴素贝叶斯方法、決策樹和径向基函数分类。 經驗風險最小化監督式學習的目標是在給定一個 (x, g(x))的集合下,去找一個函數g。 假設符合g行為的樣本集合是從某個更大甚至是無限的母體中,根據某種未知的概率分布p,以独立同分布随机变量方式來取樣。則可以假設存在某個跟任務相關的损失函数 L 其中,Y是g的陪域,且L會對應到非負實數(L可能有其它限制)。如果預測出來g的值是z,但實際值是y,而L(z, y)這個量是其間的損失。 某個函數f的風險是定義成损失函数的期望值。如果機率分佈p是離散的(如果是連續的,則可採用定積分和機率密度函數),則定義如下: 現在的目標則是在一堆可能的函數中去找函數f*,使其風險R(f*)是最小的。 然而,既然g的行為已知適用於此有限集合(x1, y1), ..., xn, yn),則我們可以求得出真實風險的近似值,譬如,其經驗風險為: 選擇會最小化經驗風險的函數f*就是一般所知的經驗風險最小化原則。統計學習理論則是研究在什麼條件下經驗風險最小化才是可行的,且預斯其近似值將能多好? 主動式學習一個情況是,有大量尚未標示的資料,但去標示資料則是很耗成本的。一種方法則是,學習演算法會主動去向使用者或老師去詢問標籤。 這種形態的監督式學習稱為主動式學習。既然學習者可以選擇例子,學習中要使用到的例子個數通常會比一般的監督式學習來得少。 以這種策略則有一個風險是,演算法可能會專注在於一些不重要或不合法的例子。 策略和演算法應用常見議題參考文獻
外部連結
|