LR(Logistic Regression) 邏輯迴歸模型進行二分類或多分類及梯度下降學習引數

邏輯迴歸(Logistic Regression, LR)是傳統機器學習中的一種分類模型，由於演算法的簡單和高效，在實際中應用非常廣泛。它的起源非常複雜，可以看參考引用1。具體應用實踐可以看這裡。

問題背景

對於二元分類問題，給定一個輸入特徵向量 $X$ (例如輸入一張圖片，通過演算法識別它是否是一隻貓的圖片)，演算法能夠輸出預測，稱之為 $\hat{y}$ ，也就是對實際值 $y$ 的估計。或者說， $\hat{y}$ 表示 $y$ 等於1的一種可能性或是置信度(前提條件是給定了輸入特徵 $X$ )。

如果代入帶線性迴歸的模型中 $\hat{y} = w^{T} x$ ：

假設輸入 $X$ 為腫瘤大小，上圖表示 $y$ 值大於0.5時演算法預測為惡性腫瘤，小於0.5時預測為良性腫瘤。看上去好像沒有什麼問題，但是在 $y$

y

值大於1或者小於0的地方不能很好地表示分類的置信度。再者看下圖：

如果新加入了一個樣本點(最右)，那麼預測很可能就會如上圖不是很準確了，惡性腫瘤的前幾個樣本點會被線性迴歸模型判定為良性腫瘤。因此我們引入sigmoid函式：

LR模型

Sigmoid函式

g (x) = \frac{1}{1 + e^{- x}}

從上圖可以看到sigmoid函式是一個s形的曲線，它的取值在[0, 1]之間，在0點取值為0.5，在遠離0的地方函式的值會很快接近0或是1。這個性質使我們能夠以概率的方式來解釋分類的結果。

所以對應條件概率分佈(二分類) $P (Y | X)$ 為

P (y = 1 | x; w) = g (w^{T} x) = \frac{1}{1 + e^{- w^{T} * x}} P (y = 0 | x; w) = g (w^{T} x) = \frac{e^{- w^{T} * x}}{1 + e^{- w^{T} * x}}

引數求解

那麼我們該如何求救裡面的引數 $w$ 呢？常用的方法有梯度下降法,牛頓法和BFGS擬牛頓法。

梯度下降法

梯度下降(Gradient Descent)又叫作最速梯度下降，是一種迭代求解的方法，通過在每一步選取使目標函式變化最快的一個方向調整引數的值來逼近最優值。基本步驟如下：

LR(Logistic Regression) 邏輯迴歸模型進行二分類或多分類及梯度下降學習引數

問題背景

LR模型

Sigmoid函式

引數求解

LR(Logistic Regression) 邏輯迴歸模型進行二分類或多分類及梯度下降學習引數

斯坦福Andrew Ng---機器學習筆記（二）：Logistic Regression(邏輯迴歸)

Logistic Regression(邏輯迴歸)

Logistic Regression--邏輯迴歸演算法彙總

spark 2.x 原始碼分析之 Logistic Regression 邏輯迴歸

Spark MLlib Logistic Regression邏輯迴歸演算法

Logistic Regression(邏輯迴歸) +python3.6(pycharm)實現

Logistic Regression 邏輯迴歸演算法例子，python程式碼實現

Logistic Regression邏輯迴歸的簡單解釋

邏輯迴歸模型(Logistic Regression, LR)基礎

機器學習演算法（一）：邏輯迴歸模型（Logistic Regression, LR）

邏輯迴歸模型（logistic regression）

為什麽邏輯斯特回歸(logistic regression)是線性模型

LR模型（邏輯迴歸模型）

Logistic Regression(邏輯斯特迴歸)

Logistic Regression 邏輯回歸

Logistic Regression邏輯回歸

coursera 機器學習 logistic regression 邏輯回歸的項目

清華AI自強計劃作業2實驗—邏輯迴歸模型

tensorflow構造邏輯迴歸模型

LR(Logistic Regression) 邏輯迴歸模型 進行二分類或多分類 及梯度下降學習引數

問題背景

LR模型

Sigmoid函式

引數求解

LR(Logistic Regression) 邏輯迴歸模型進行二分類或多分類及梯度下降學習引數