Sigmoid函式

簡介

sigmoid函式也叫Logistic函式，用於隱層神經元輸出，取值範圍為(0,1)，它可以將一個實數映射到(0,1)的區間，可以用來做二分類。在特徵相差比較複雜或是相差不是特別大時效果比較好。Sigmoid作為激活函式有以下優缺點：

優點：平滑、易於求導。

缺點：激活函式計算量大，反向傳播求誤差梯度時，求導涉及除法；反向傳播時，很容易就會出現梯度消失的情況，從而無法完成深層網路的訓練。

Sigmoid函式由下列公式定義

其對x的導數可以用自身表示：

Sigmoid函式的圖形如S曲線

Sigmoid函式的級數表示：

激活函式

在計算機網路中，一個節點的激活函式定義了該節點在給定的輸入或輸入的集合下的輸出。標準的計算機晶片電路可以看作是根據輸入得到開（1）或關（0）輸出的數字電路激活函式。這與神經網路中的線性感知機的行為類似。然而，只有非線性激活函式才允許這種網路僅使用少量節點來計算非平凡問題。在人工神經網路中，這個功能也被稱為傳遞函式。

sigmoid函式和tanh函式是研究早期被廣泛使用的2種激活函式。兩者都為S 型飽和函式。當sigmoid 函式輸入的值趨於正無窮或負無窮時，梯度會趨近零，從而發生梯度彌散現象。sigmoid函式的輸出恆為正值，不是以零為中心的，這會導致權值更新時只能朝一個方向更新，從而影響收斂速度。tanh 激活函式是sigmoid 函式的改進版，是以零為中心的對稱函式，收斂速度快，不容易出現 loss 值晃動，但是無法解決梯度彌散的問題。2個函式的計算量都是指數級的，計算相對複雜。softsign 函式是 tanh 函式的改進版，為 S 型飽和函式，以零為中心，值域為（−1，1）。

邏輯回歸

logistic回歸是一種廣義線性回歸（generalized linear model），因此與多重線性回歸分析有很多相同之處。它們的模型形式基本上相同，都具有 w‘x+b，其中w和b是待求參數，其區別在於他們的因變數不同，多重線性回歸直接將w‘x+b作為因變數，即y =w‘x+b，而logistic回歸則通過函式L將w‘x+b對應一個隱狀態p，p =L(w‘x+b),然後根據p 與1-p的大小決定因變數的值。如果L是logistic函式，就是logistic回歸，如果L是多項式函式就是多項式回歸。 logistic回歸的因變數可以是二分類的，也可以是多分類的，但是二分類的更為常用，也更加容易解釋，多類可以使用softmax方法進行處理。實際中最為常用的就是二分類的logistic回歸。Logistic回歸模型的適用條件：

1 因變數為二分類的分類變數或某事件的發生率，並且是數值型變數。但是需要注意，重複計數現象指標不適用於Logistic回歸。

2 殘差和因變數都要服從二項分布。二項分布對應的是分類變數，所以不是常態分配，進而不是用最小二乘法，而是最大似然法來解決方程估計和檢驗問題。

Sigmoid函式

基本介紹

簡介

激活函式

邏輯回歸

實現

相關詞條

熱門詞條