代理損失函式或者稱為替代損失函式,一般是指當目標函式非凸、不連續時,數學性質不好,最佳化起來比較複雜,這時候需要使用其他的性能較好的函式進行替換。
基本介紹
- 中文名:代理損失函式
- 外文名:surrogate loss function
定義,性質,
定義
在二元分類問題中,假如我們有n個訓練樣本{(X1,y1),(X2,y2),⋯,(Xn,yn)},其中yi∈{0,1}。為了量化一個模型的好壞,我們通常使用一些損失函式,損失函式越小,模型越好。最常用的損失函式就是零一損失函式
。








這個函式顯然是非連續的。常用的最佳化方法,比如梯度下降,對此都失效了。正因此,可以考慮一個與零一損失相接近的函式,作為零一損失的替身。這個替身就稱作代理損失函式(surrogate loss function)。
性質
如果最最佳化代理損失函式的同時也最最佳化了原本的損失函式,就稱校對性(calibration)或者一致性(consistency)。這個性質與所選擇的代理損失函式相關。一個重要的定理是,如果代理損失函式是凸函式,並且在0點可導,其導數小於0,那么它一定是具有一致性的。
零一損失函式與logloss,hinge loss,squared hinge loss以及modified Huber loss的聯繫如下圖:
