1. 程式人生 > 程式設計 >Python 支援向量機分類器的實現

Python 支援向量機分類器的實現

支援向量機(Support Vector Machine,SVM)是一類按監督學習(supervised learning)方式對資料進行二元分類的廣義線性分類器(generalized linear classifier),其決策邊界是對學習樣本求解的最大邊距超平面(maximum-margin hyperplane)

SVM使用鉸鏈損失函式(hinge loss)計算經驗風險(empirical risk)並在求解系統中加入了正則化項以優化結構風險(structural risk),是一個具有稀疏性和穩健性的分類器。SVM可以通過核方法(kernel method)進行非線性分類,是常見的核學習(kernel learning)方法之一。

SVM被提出於1964年,在二十世紀90年代後得到快速發展並衍生出一系列改進和擴充套件演算法,在人像識別、文字分類等模式識別(pattern recognition)問題中有得到應用。

import numpy as np
from scipy import io as spio
from matplotlib import pyplot as plt
from sklearn import svm
 
 
def SVM():
  '''data1——線性分類'''
  data1 = spio.loadmat('data1.mat')
  X = data1['X']
  y = data1['y']
  y = np.ravel(y)
  plot_data(X,y)
 
  model = svm.SVC(C=1.0,kernel='linear').fit(X,y) # 指定核函式為線性核函式
  plot_decisionBoundary(X,y,model) # 畫決策邊界
  '''data2——非線性分類'''
  data2 = spio.loadmat('data2.mat')
  X = data2['X']
  y = data2['y']
  y = np.ravel(y)
  plt = plot_data(X,y)
  plt.show()
 
  model = svm.SVC(gamma=100).fit(X,y) # gamma為核函式的係數,值越大擬合的越好
  plot_decisionBoundary(X,model,class_='notLinear') # 畫決策邊界
 
 
# 作圖
def plot_data(X,y):
  plt.figure(figsize=(10,8))
  pos = np.where(y == 1) # 找到y=1的位置
  neg = np.where(y == 0) # 找到y=0的位置
  p1,= plt.plot(np.ravel(X[pos,0]),np.ravel(X[pos,1]),'ro',markersize=8)
  p2,= plt.plot(np.ravel(X[neg,np.ravel(X[neg,'g^',markersize=8)
  plt.xlabel("X1")
  plt.ylabel("X2")
  plt.legend([p1,p2],["y==1","y==0"])
  return plt
 
 
# 畫決策邊界
def plot_decisionBoundary(X,class_='linear'):
  plt = plot_data(X,y)
 
  # 線性邊界    
  if class_ == 'linear':
    w = model.coef_
    b = model.intercept_
    xp = np.linspace(np.min(X[:,np.max(X[:,100)
    yp = -(w[0,0] * xp + b) / w[0,1]
    plt.plot(xp,yp,'b-',linewidth=2.0)
    plt.show()
  else: # 非線性邊界
    x_1 = np.transpose(np.linspace(np.min(X[:,100).reshape(1,-1))
    x_2 = np.transpose(np.linspace(np.min(X[:,-1))
    X1,X2 = np.meshgrid(x_1,x_2)
    vals = np.zeros(X1.shape)
    for i in range(X1.shape[1]):
      this_X = np.hstack((X1[:,i].reshape(-1,1),X2[:,1)))
      vals[:,i] = model.predict(this_X)
 
    plt.contour(X1,X2,vals,[0,1],color='blue')
    plt.show()
 
 
if __name__ == "__main__":
  SVM()

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。