利用廣義線性模型解決二分類任務的一種方法。
基本介紹
- 中文名:對數幾率回歸
- 外文名:logistic regression或logit regression
定義,性質,套用,
對數幾率回歸,簡稱對率回歸,又稱邏輯回歸,是使用Sigmoid函式作為聯繫函式時的廣義線性模型,是廣義線性模型的一個特例。
定義
假設要用列向量
預測二分類結果
,有數據集
。
![](/img/5/38b/a0a8e37220886db60397b1c731bf.jpg)
![](/img/d/ae6/f72098680bd6161e50cda0193b21.jpg)
![](/img/7/07d/959a509e4f73ac7e267fcdacf671.jpg)
由廣義線性模型
可知,只要找一個聯繫函式
,其值域為
即可。
![](/img/b/698/ccbad53e2172f2e3a67c3741a14d.jpg)
![](/img/c/257/d4dca0b950fff645ef8a22410321.jpg)
![](/img/7/453/38bd85e8b808a79761d92fe48c60.jpg)
最理想的聯繫函式是單位階躍函式(unit-step function)
。
![](/img/d/ad4/427ef8d221449f7528dcadd86072.jpg)
但是單位階躍函式不連續,難以求導,所以用對數幾率函式代替。
對數幾率函式(logistic function),簡稱對率函式,定義式為
。
![](/img/5/15e/094b48c23502f2998ff704aba6fb.jpg)
得到擬合模型
。
![](/img/e/af6/0fb7957f9543f7dfe6015d6a2a88.jpg)
為簡便起見,設
,
,則有
。
![](/img/9/558/23af4c45a0c6ce89b3bfb94b773d.jpg)
![](/img/1/726/b91e3529bee216bb497934e3179f.jpg)
![](/img/3/139/afa127a92ce6c7f37da687935a26.jpg)
下面將擬合模型的因變數看作
的機率,使用極大似然法。
![](/img/7/aef/9cf3d62b9cdae53789b21503cea0.jpg)
對於數據集的每一個樣本,有機率
。
![](/img/3/8c8/15bc640e328a4a0392b0e58a393f.jpg)
考慮到
,則有![](/img/c/904/736606cf98f0e5171b14b586c89f.jpg)
![](/img/9/3cc/5bee3adb5bf0d88d3c16bc7b75c5.jpg)
![](/img/c/904/736606cf98f0e5171b14b586c89f.jpg)
求出令損失函式
最小時的
值,就可求出模型參數。
![](/img/7/a25/d17382c2d2b3f5c4d22116e19c60.jpg)
![](/img/e/68f/bcbeeca5994e29f71b7e88e061a4.jpg)
性質
可使用梯度下降法、牛頓法等求損失函式
最小時的
參數值。
![](/img/e/502/5e1c2192b442c2bada1bb26b879e.jpg)
![](/img/2/12d/236e46afe78670435c96fe8b15d0.jpg)
套用
二分類任務