支援向量機演算法的實現和應用（Python3超詳細的原始碼實現+圖介紹）

阿新 • • 發佈：2018-11-28

支援向量機演算法的實現和應用，因為自己推到過SVM，建議自己推到一遍，這裡不對SVM原理做詳細的說明。

原理公式推到推薦看：https://blog.csdn.net/jcjx0315/article/details/61929439

#!/usr/bin/env python
# encoding: utf-8
"""
@Company：華中科技大學電氣學院聚變與等離子研究所
@version: V1.0
@author: Victor
@contact: [email protected]  2018--2020
@software: PyCharm
@file: SVM.py
@time: 2018/11/25 12:48
@Desc：支援向量機演算法的實現和應用，因為自己推到過SVM，建議自己推到一遍，
       這裡不對SVM原理做詳細的說明。
"""
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

##使用seaborn plotting 的預設引數
import seaborn as sns;sns.set()

'''支援向量機的基本原理：將低維不可分的資料問題經過核
函式轉化為高維可分，再找到超平面進行分開'''


###隨機一些資料，並可視化出來便於觀看
from sklearn.datasets.samples_generator import make_blobs

##自己定義資料集的結構，引數 n_samples:一共多少樣本點；centers：分為多少簇；
##                        random_state：確定隨機種子，保證每次的資料都是一樣的
##                        cluster_std：每個簇的離散程度，越大越分散，越小越集中更好分類
##X是樣本資料座標，y是標籤
X,y = make_blobs(n_samples=50,centers=2,random_state=0,cluster_std=0.6)
##視覺化隨機資料
plt.figure(1)
plt.scatter(X[:,0],X[:,1],c = y,s = 60 ,cmap = 'autumn')

探索性切分資料，畫線：

plt.figure(2)
xfit = np.linspace(-1,3.5)
plt.scatter(X[:,0],X[:,1],c = y,s = 60 ,cmap = 'autumn')
plt.plot([0.6],[2.1],'x',color = 'red',markeredgewidth = 2,markersize = 10)##畫了一個X點

##以X點畫幾條切分線
for m,b in [(1,0.65),(0.5,1.6),(-0.2,2.9)]:
    ##m為斜率
    plt.plot(xfit,m*xfit+b,'-k')
plt.xlim(-1,3.5)

給每條線構造陰影區域，表示隔離帶，先直觀上看看那條比較好

plt.figure(3)
xfit = np.linspace(-1,3.5)
plt.scatter(X[:,0],X[:,1],c = y,s = 60 ,cmap = 'autumn')
plt.plot([0.6],[2.1],'x',color = 'red',markeredgewidth = 2,markersize = 10)##畫了一個X點

##以X點畫幾條切分線
for m,b,d in [(1,0.65,0.33),(0.5,1.6,0.55),(-0.2,2.9,0.2)]:
    ##m為斜率
    yfit = m*xfit+b
    plt.plot(xfit,yfit,'-k')
    plt.fill_between(xfit,yfit - d,yfit + d,edgecolor = 'none',color = '#AAAAAA',alpha = 0.4)
plt.xlim(-1,3.5)

構造支援向量機模型的基本思想：首先找到距離決策邊界最近的樣本點，然後使該點到該邊界的距離越遠越好

'''構造支援向量機模型的基本思想：首先找到距離決策邊界最近的樣本點，然後使該點到該邊界的距離越遠越好'''
from sklearn.svm import SVC  ###支援向量機的一個分類器
model = SVC(kernel='linear')##核函式選用線性分類
###開始訓練一個基本的SVM
model.fit(X,y)


# 繪圖函式，邊界上的點才是支援向量，係數不等於0，非邊界上的係數值等於0.
def plot_svc_decision_function(model, ax=None, plot_support=True):
    """Plot the decision function for a 2D SVC"""
    if ax is None:
        ax = plt.gca()
    xlim = ax.get_xlim()
    ylim = ax.get_ylim()

    # create grid to evaluate model
    x = np.linspace(xlim[0], xlim[1], 30)
    y = np.linspace(ylim[0], ylim[1], 30)
    Y, X = np.meshgrid(y, x)
    xy = np.vstack([X.ravel(), Y.ravel()]).T
    P = model.decision_function(xy).reshape(X.shape)

    # 畫決策邊界和邊緣
    ax.contour(X, Y, P, colors='k',
               levels=[-1, 0, 1], alpha=0.5,
               linestyles=['--', '-', '--'])

    # 畫支援向量
    if plot_support:
        ax.scatter(model.support_vectors_[:, 0],
                   model.support_vectors_[:, 1],
                   s=250, linewidth=1, facecolors='b')
    ax.set_xlim(xlim)
    ax.set_ylim(ylim)

plt.figure(4)
plt.scatter(X[:,0],X[:,1],c = y,s = 60 ,cmap = 'autumn')
plot_svc_decision_function(model)

###輸出支援向量的座標：
print(model.support_vectors_)
# [[0.44359863 3.11530945]
#  [2.33812285 3.43116792]
#  [2.06156753 1.96918596]]

改變資料的個數【60，120】，只要支援向量不變，決策邊界就不改變。

'''改變資料的個數【60，120】，只要支援向量不變，決策邊界就不改變'''
def plot_svm(N=10, ax=None):
    X, y = make_blobs(n_samples=200, centers=2,
                      random_state=0, cluster_std=0.60)
    X = X[:N]
    y = y[:N]
    model = SVC(kernel='linear', C=1E10)
    model.fit(X, y)

    ax = ax or plt.gca()
    ax.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='autumn')
    ax.set_xlim(-1, 4)
    ax.set_ylim(-1, 6)
    plot_svc_decision_function(model, ax)

fig, ax = plt.subplots(1, 2, figsize=(12, 6))
fig.subplots_adjust(left=0.0625, right=0.95, wspace=0.1)
for axi, N in zip(ax, [60, 120]):
    plot_svm(N, axi)
    axi.set_title('N = {0}'.format(N))

引入核函式的SVM

###重新構造資料集
from sklearn.datasets.samples_generator import make_circles
X, y = make_circles(100, factor=.1, noise=.1)###圓環型的資料集

clf = SVC(kernel='linear').fit(X, y)##先採用線性的SVM
plt.figure(6)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='autumn')
plot_svc_decision_function(clf, plot_support=False)

將二維的資料變換到三維，畫圖直觀表示出來，更容易切分

#加入了新的維度r
from mpl_toolkits import mplot3d
r = np.exp(-(X ** 2).sum(1))
def plot_3D(elev=30, azim=30, X=X, y=y):
    ax = plt.subplot(projection='3d')
    ax.scatter3D(X[:, 0], X[:, 1], r, c=y, s=50, cmap='autumn')
    ax.view_init(elev=elev, azim=azim)
    ax.set_xlabel('x')
    ax.set_ylabel('y')
    ax.set_zlabel('r')
plt.figure(7)
plot_3D(elev=45, azim=45, X=X, y=y)

實際做法：將低維對映到高維，再切分

#加入徑向基函式（就是高斯核函式或者rbf核函式），都是高斯變換
clf = SVC(kernel='rbf', C=1E6)
clf.fit(X, y)
###非線性劃分展示
plt.figure(8)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='autumn')
plot_svc_decision_function(clf)
plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1],
            s=300, lw=1, facecolors='none')

SVM引數之Soft Margin問題

調節C引數：當C趨近於無窮大時：意味著分類嚴格不能有錯誤

當C趨近於很小的時：意味著可以有更大的錯誤容忍

###重新隨機一些資料，使離散程度更大一些
plt.figure(9)
X, y = make_blobs(n_samples=100, centers=2,
                  random_state=0, cluster_std=0.8)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='autumn')

改變C引數的大小對結果的影響

###改變C引數的大小對結果的影響，可以看到，C太大劃分更嚴格，泛化能力更弱，適合要求
###C小，要求越放鬆。
###通常用交叉驗證來評判哪個效果好，就取哪個C
X, y = make_blobs(n_samples=100, centers=2,
                  random_state=0, cluster_std=0.8)

fig, ax = plt.subplots(1, 2, figsize=(13, 6))
fig.subplots_adjust(left=0.0625, right=0.95, wspace=0.1)

for axi, C in zip(ax, [10.0, 0.1]):##分別取得ax，10；ax，0.1賦給axi，C然後執行迴圈。
    model1 = SVC(kernel='linear', C=C).fit(X, y)
    axi.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='autumn')
    plot_svc_decision_function(model1, axi)
    axi.scatter(model1.support_vectors_[:, 0],
                model1.support_vectors_[:, 1],
                s=300, lw=1, facecolors='none');
    axi.set_title('C = {0:.1f}'.format(C), size=14)

探究高斯核函式中的gamma係數

#####探究高斯核函式中的gamma係數：
#####                控制模型的一些複雜程度，
#####                越大的gamma值，表示對映的維度越高，模型越複雜，可能會讓所有點都成了支援向量
#####                越小，模型越精簡，結果更平穩。所以精度並不能直接說明模型好壞
X, y = make_blobs(n_samples=100, centers=2,
                  random_state=0, cluster_std=1.1)

fig, ax = plt.subplots(1, 2, figsize=(14, 6))
fig.subplots_adjust(left=0.0625, right=0.95, wspace=0.1)

for axi, gamma in zip(ax, [10.0, 0.1]):
    model = SVC(kernel='rbf', gamma=gamma).fit(X, y)
    axi.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='autumn')
    plot_svc_decision_function(model, axi)
    axi.scatter(model.support_vectors_[:, 0],
                model.support_vectors_[:, 1],
                s=300, lw=1, facecolors='none');
    axi.set_title('gamma = {0:.1f}'.format(gamma), size=14)

對圖的解釋已經在程式碼註釋中了，可以詳細看看支援向量機是如何一步步開展的。

支援向量機演算法的實現和應用（Python3超詳細的原始碼實現+圖介紹）

支援向量機演算法的實現和應用，因為自己推到過SVM，建議自己推到一遍，這裡不對SVM原理做詳細的說明。原理公式推到推薦看：https://blog.csdn.net/jcjx0315/article/details/61929439 #!/usr/bin/env python # enc

支援向量機—SMO論文詳解（序列最小最優化演算法）

SVM的學習演算法可以歸結為凸二次規劃問題。這樣的凸二次規劃問題具有全域性最優解，並且許多最優化演算法可以用來求解，但是當訓練樣本容量很大時，這些演算法往往變得非常低效，以致無法使用。論文《Sequential Minimal Optimization：A Fast Algori

支援向量機演算法與實現

1 演算法思想支援向量機(support vector machines) 是找到一個超平面(hyperplane)將資料劃分為一類與其他類的一種二類分類模型，分離間隔最大而區別於感知機。適用於：資料可直接分為兩類(採用error-correcting

在matlab環境下實現支援向量機演算法

作者：faaronzheng 轉載請註明出處！關於支援向量機的理論部分我就不進行介紹了，網上有很多關於支援向量機的講解。如：支援向量機通俗導論（理解SVM的三層境界）有興趣的可以自行查詢一下。這裡我主要介紹一下如何在matlab環境下自己實現支援向量機演

並行支援向量機演算法的知識點之喬里斯基分解（Cholesky factorization）

Cholesky factorization 已知矩陣：且是對稱正定矩陣，則可以分解為：，其中為下三角矩陣。證明：有兩種方法求，一種是按行求，另一種是按列求。先說第一種方法，遞推法按行求

【機器學習實戰】支援向量機----分類庫和簡單訓練mnist

前面已經對mnist資料集進行了讀取，現在我們可以直接使用sklearn.svm模組中的演算法庫對mnist資料集進行訓練。【svm模組】演算法庫： sklearn.svm模組中提供了這些庫：大概分成這幾類(除了svm_l1_min_c

SVM-支援向量機演算法概述

（一）SVM的背景簡介支援向量機(Support Vector Machine)是Cortes和Vapnik於1995年首先提出的，它在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢，並能夠推廣應用到函式擬合等其他機器學習問題中[10]。支援向量機方法是建立在

SVM-支援向量機演算法概述 ---一篇非常深入淺出介紹SVM的文章

支援向量機數學證明與推導（SVM）

支援向量機（SVM） @(資料探勘)[svm] 一、線性可分支援向量機和硬間隔最大化名詞解釋線性可分：就是指給定一組資料集T={(x1,y1),(x2,y2),⋯,(x

支援向量機SVM----學習筆記三（程式碼實踐一高斯核函式）

import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.preprocessing import StandardScaler from sklearn.svm import SV

【機器學習】支援向量機SVM及例項應用

【機器學習】支援向量機1.分類超平面與最大間隔2.對偶問題與拉格朗日乘子法3.核函式4.軟間隔與正則化準備：資料集匯入SVM模組步驟：1.讀取資料集 2.劃分訓練樣本與測試樣本 3.訓練SVM

機器學習之支援向量機演算法例項

此例項是利用svm演算法預測乳腺癌腫瘤是良性還是惡性，資料格式如下圖所示：第一列表示編號，2到10列表示資料屬性，第11列表示腫瘤標籤2表示良性4表示惡性。程式碼如下 from sklearn import svm # x = [[2, 0], [1, 1], [

特徵選擇之支援向量機遞迴特徵消除（SVM-RFE）

支援向量機遞迴特徵消除(下文簡稱SVM-RFE)是由Guyon等人在對癌症分類時提出來的，最初只能對兩類資料進行特徵提取。它是一種基於Embedded方法。支援向量機支援向量機廣泛用於模式識別，機器學習等領域，SVM採用結構風險最小化原則，同時最小化

機器學習之支援向量機演算法(一)

一、問題引入　　支援向量機(SVM，Support Vector Machine)在2012年前還是很牛逼的，但是在12年之後神經網路更牛逼些，但是由於應用場景以及應用演算法的不同，我們還是很有必要了解SVM的，而且在面試的過程中SVM一般都會問到。支援向量機是一個非常經典且高效的分類模型。我們的目標：基

機器學習之支援向量機演算法(二)

五、SVM求解例項　　上面其實已經得出最終的表示式了，下面我們會根據一些具體的點來求解α的值。資料：3個點，其中正例 X1(3,3) ，X2(4,3) ，負例X3(1,1) 如下圖所示　　　　　我們需要求解下式的極小值　　　　　注意約束條件（在這裡不要忘記了yi代表的是資料

SVM 支援向量機演算法-原理篇

> **公號：碼農充電站pro** > **主頁：** 本篇來介紹**SVM 演算法**，它的英文全稱是 *Support Vector Machine*，中文翻譯為**支援向量機**。之所以叫作支援向量機，是因為該演算法最終訓練出來的模型，由一些**支援向量**決定。所謂的支援向量，也就是能夠決定最終

SVM 支援向量機演算法-實戰篇

> **公號：碼農充電站pro** > **主頁：** [上一篇](https://www.cnblogs.com/codeshell/p/14301569.html)介紹了 SVM 的原理和一些基本概念，本篇來介紹如何用 SVM 處理實際問題。 ### 1，SVM 的實現 **SVM 演算法**即可以

資料結構與演算法 -- 棧的應用（進位制轉換、括號匹配）

棧的應用 ps：用棧很簡單實現的應用有很多，比如說進位制轉換，括號匹配等。學計算機的都知道，2進位制，8進位制，10進位制，16進位制等，進位制之間的轉換也是需要掌握的，以備不時之需，所以我們可以自己寫一段程式如果會android的話，可以直接打包成APK。下面就按照這兩個應用稍微寫一點C語言的程式碼。進

(3).支援向量機SVM——軟間隔最大化公式手寫詳細推導

線性可分問題的支援向量機學習方法，對線性不可分訓練資料是不適應的，因為這時上一節中不等式約束不能成立，如何擴充套件到線性不可分問題呢？這就需要修改硬間隔最大化，使其成為軟間隔最大化。通常情況下訓練資料中有一些特異的點，將這些特異的點去處後，剩下的樣本組成的集合是線性可分的。線性不可分的意思

支援向量機（SVM）和python實現（三）

6. python實現根據前面的一步步推導獲得的結果，我們就可以使用python來實現SVM了這裡我們使用iris資料集進行驗證，由於該資料集有4維，不容易在二維平面上表示，我們先使用LDA對其進行降維，又因為該資料集有3類樣本，我們編寫的SVM是二分類的，所以我們將

支援向量機演算法的實現和應用（Python3超詳細的原始碼實現+圖介紹）

相關推薦