1. 程式人生 > >邏輯回歸(分類算法)

邏輯回歸(分類算法)

分類問題 定性 oid 一個 關系 多分類 研究 根據 bsp

1.什麽是邏輯回歸

在前面講述的回歸模型中,處理的因變量都是數值型區間變量,建立的模型描述是因變量的期望與自變量之間的線性關系。比如常見的線性回歸模型:

                技術分享圖片

而在采用回歸模型分析實際問題中,所研究的變量往往不全是區間變量而是順序變量或屬性變量,比如二項分布問題。通過分析年齡、性別、體質指數、平均血壓、疾病指數等指標,判斷一個人是否換糖尿病,Y=0表示未患病,Y=1表示患病,這裏的響應變量是一個兩點(0-1)分布變量,它就不能用h函數連續的值來預測因變量Y(只能取0或1)。
總之,線性回歸模型通常是處理因變量是連續變量的問題,如果因變量是定性變量,線性回歸模型就不再適用了,需采用邏輯回歸模型解決。

邏輯回歸(Logistic Regression)是用於處理因變量為分類變量的回歸問題,常見的是二分類或二項分布問題,也可以處理多分類問題,它實際上是屬於一種分類方法

2.邏輯回歸的推導

  1.Sigmoid 函數:

    Logistic Regression雖然名字裏帶“回歸”,但是它實際上是一種分類方法,用於兩分類問題(即輸出只有兩種)。根據第二章中的步驟,需要先找到一個預測函數(h),顯然,該函數的輸出必須是兩個值(分別代表兩個類別)

    所以利用了Logistic函數(或稱為Sigmoid函數),函數形式為:

            技術分享圖片

   二分類問題的概率與自變量之間的關系圖形往往是一個S型曲線,如圖所示,采用的Sigmoid函數實現:

        技術分享圖片技術分享圖片

邏輯回歸(分類算法)