最陡下降算法

描述

梯度下降方法基於以下的觀察：如果實值函式

在點a處可微且有定義，那么函式

在點a沿著梯度相反的方向

下降最快。

因而，如果

對於

為一個夠小數值時成立，那么

。

考慮到這一點，我們可以從函式

的局部極小值的初始估計

出發，並考慮如下序列

,

..使

因此可得到

如果順利的話序列

收斂到期望的極值。注意每次疊代步長

可以改變。

圖片示例了這一過程，這裡假設

為常數的集合構成的曲線。紅色的箭頭指向該點梯度的反方向。（一點處的梯度方向與通過該點的等高線垂直）。沿著梯度下降方向，將最終到達碗底，即函式

值最小的點。

算法框圖如下：

梯度下降法處理一些複雜的非線性函式會出現問題，例如Rosenbrock函式：

其最小值在（x,y）=(1,1)處，數值為0,但是此函式具有狹窄彎曲的山谷

，最小值（x,y）=(1,1)就在這些山谷之中，並且谷底很平。最佳化過程是之字形的向極小值點靠近，速度非常緩慢。

梯度下降法的缺點包括：

靠近極小值時速度減慢；

直線搜尋可能會產生一些問題；

可能會“之字型”地下降。