機器學習（7）——支援向量機（二）：線性可分支援向量機到非線性支援向量機

線性可分支援向量機

回顧

前面總結了線性可分支援向量機，知道了支援向量機的最終目的就是通過“間隔最大化” 得到最優分類器，能夠使最難區分的樣本點得到最大的分類確信度，而這些難區分的樣本就是支援向量。
還是如下圖所示，超平面H1 和 H2 支撐著中間的決策邊界，且到達決策邊界的距離相等，都是最大幾何間隔。而這兩個超平面H1 和 H2 必定會有一些樣本點，不然中間的間隔還可以繼續擴大，得到的就不是最大間隔了。這些在超平面H1 和 H2 的樣本點就是支援向量，從直觀上我們也可看出，這些支援向量是離決策邊界最近的點，也就是最難被分類的樣本。
這裡寫圖片描述

優化

上一節中我們介紹了得到上述線性可分支援向量機的方法，即最優化以下目標函式：

minw,bs.t.12||w||2yi(wT⋅xi+b)≥1,i=1,2,…,N
觀察可知，這是一個明顯的凸二次規劃問題。將其作為原始問題，應用拉格朗日對偶性，通過求解對偶問題得到原始問題的最優解。這樣求解有兩個好處：一方面是對偶問題往往更容易求解（優化效率高）；二是自然引入了核函式，進而能夠推廣到非線性分類問題。首先，通過上式我們可以定義拉格朗日函式為：
L(w,b,α)=12||w||2−∑i=1Nαi[yi(wT⋅xi+b)−1]
其中，拉格朗日乘子αi≥0 ，現在我們令：
θp(w)=maxαi≥0L(w,b,α)
則 θp(w) 就是與原目標函式等同的優化問題。之所以可以這麼等同，是因為如果出現y

i(wT⋅xi+b)<1 則 θp(w)=∞（只需要令αi=∞），此時沒有最小解。而當所有約束條件都滿足時，即 yi(wT⋅xi+b)≥1,i=1,2,…,N，則 θp(w)=12||w||2,也就是我們最初要優化的目標函式。因此，我們現在的目標函式可以改寫為：
minwθp(w)=minwmaxαi≥0L(w,b,α)
我們令 p∗ 為該目標函式的最優化結果，直接求解的效率沒有對偶問題求解高效（具體優化效率比較還沒弄懂）。我們不妨考慮另外一個問題：
θD(α)=minw,bL(w,b,α)
D 表示對偶，θD(α) 將問題轉化為先求拉格朗日關於 w 和 b 的最小值，將α 看著固定值，然後求關於α

的極大值, 則優化問題轉化為：
maxαθD(α)=maxαminw,bL(w,b,α)=d∗
對偶問題與原始問題並不完全等價，因此我們用

機器學習（7）——支援向量機（二）：線性可分支援向量機到非線性支援向量機

線性可分支援向量機

回顧

優化

機器學習（7）——支援向量機（二）：線性可分支援向量機到非線性支援向量機

支援向量機學習筆記（一）：線性可分支援向量機

詳解SVM系列（三）：線性可分支援向量機與硬間隔最大化

支援向量機（support vector machine）（一）：線性可分SVM

SVM學習記錄1：線性可分硬間隔最大化

機器學習：SVM（一）——線性可分支援向量機原理與公式推導

機器學習第三個演算法SVM上（支援向量機）

SVM支援向量機-《機器學習實戰》SMO演算法Python實現（5）

【深度學習基礎-05】支援向量機SVM（上）-線性可分

SVM支援向量機系列理論（二）線性可分SVM模型的對偶問題

機器學習 Python scikit-learn 中文文件（7）模型選擇: 選擇合適的估計器及其引數

機器學習筆記7——異常檢測（Anomaly Detection）

機器學習sklearn庫的使用--部署環境（python2.7 windows7 64bit）

分類演算法----線性可分支援向量機（SVM）演算法的原理推導

常用牛人主頁鏈接（計算機視覺、模式識別、機器學習相關方向,陸續更新。。。。）【轉】

機器學習筆記 1 LMS和梯度下降（批梯度下降） 20170617

Andrew Ng機器學習筆記+Weka相關算法實現（四）SVM和原始對偶問題

機器學習&數據挖掘筆記_16（常見面試之機器學習算法思想簡單梳理）

【機器學習】谷歌的速成課程（一）

機器學習--DIY筆記與感悟--②決策樹（1）

機器學習（7）——支援向量機（二）：線性可分支援向量機到非線性支援向量機

線性可分支援向量機

回顧

優化

相關推薦