損失函式

函式定義

在樣本空間

內有可測狀態

和隨機變數

根據法則

所做的決策

，此時若在乘積空間

上有函式

滿足：

，即對任意的

，

是非負可測函式，則

被稱為損失函式，表示狀態

下採取決策

所對應的損失或風險。

機器學習中，給定獨立同分布（independent and identically distributed,iid）的學習樣本

，和模型

，損失函式是模型輸出和觀測結果間機率分布差異的量化：

式中

表示模型參數，上式右側具體的量化方法視問題和模型而定，但要求滿足損失函式的一般定義，即樣本空間的非負可測函式。

函式分類

回歸問題

回歸問題所對應的損失函式為L₂損失函式和L₁損失函式，二者度量了模型估計值

與觀測值

之間的差異：

式中

為真實值的權重，

為真實值，

為模型的輸出。各類回歸模型，例如線性回歸、廣義線性模型（Generalized Linear Model, GLM）和人工神經網路（Artificial Neural Network, ANN）通過最小化L₂或L₁損失對其參數進行估計。L₂損失和L₁損失的不同在於，L₂損失通過平方計算放大了估計值和真實值的距離，因此對偏離觀測值的輸出給予很大的懲罰。此外，L₂損失是平滑函式，在求解其最佳化問題時有利於誤差梯度的計算；L₁損失對估計值和真實值之差取絕對值，對偏離真實值的輸出不敏感，因此在觀測中存在異常值時有利於保持模型穩定。

分類問題

分類問題所對應的損失函式為0-1損失，其是分類準確度的度量，對分類正確的估計值取0，反之取1：

0-1損失函式是一個不連續的分段函式，不利於求解其最小化問題，因此在套用可構造其代理損失（surrogate loss）。代理損失是與原損失函式具有相合性（consistency）的損失函式，最小化代理損失所得的模型參數也是最小化原損失函式的解。當一個函式是連續凸函式，並在任意取值下是0-1損失函式的上界時，該函式可作為0-1損失函式的代理函式。

這裡給出二元分類（binary classification）中0-1損失函式的代理損失：

二元分類中常見的代理損失

名稱	表達式
鉸鏈損失函式（hinge loss function）
交叉熵損失函式（cross-entropy loss function）
指數損失函式（exponential loss function）

鉸鏈損失（實線）、交叉熵損失（點）、指數損失（虛線）

損失函式

基本介紹

函式定義

函式分類

回歸問題

分類問題

相關詞條

熱門詞條