2015年4月11日 星期六

整體學習(Ensemble Learning)入門

(轉載)
 “監督學習(Supervised Learning)”是各種統計學習方法中最單純,最容易理解 的形式。
一般而言,監督學習的正規定義可以這樣來描述。
每筆資料點(data point) 是由一個特徵向量,我們以 表示之,和一個類別標籤(class label) 所組成;同 時,假定有一個未知(underlying)的函式 存在,對於每一筆訓練的資料點 來說, 是恆成立的。
於是學習演算法的目標就是要找一個令人滿意的近 似函式h,並使得針對任何一筆新增的特徵向量 Χ y f Χ y),( fy Χ= )( Χnew 所求得的類別標籤 可以 愈接近原始函式 計算的結果。
這個近似函式 ,我們就稱為分類器(classifier), 如此命名的原因,是因為它可以將輸入的特徵向量分發或歸類到某一個真實或接 近真實的類別。
監督學習能被應用於很多的問題上,包括手寫辨識、醫學診斷和 部分語音或文字的標籤處理。..詳文... 整體學習(Ensemble Learning)入門