K-近鄰演算法的一個簡單例子

阿新 • • 發佈：2019-01-10

k近鄰演算法思想很簡單，一個類的資料之間距離較近，單純比較距離就好，下面註釋比較清楚，常犯的錯誤也已經標記出來了
import numpy as np
import operator
from matplotlib import pyplot as plt
def classify0(inX,dataSet,labels,k):
    dataSetSize=dataSet.shape[0]
    diffMat=np.tile(inX,(dataSetSize,1))-dataSet               #計算輸入資料點與訓練集資料點的差值
    sqDiffMat=diffMat**2
    sqDistances=sqDiffMat.sum(axis=1)                          #計算與各個訓練集資料點的距離
    distance=sqDistances**0.5
    sortedDistIndicies=np.argsort(distance)                    #返回distance按照從小到大排序的序列的索引
    classCount={}                                              #建立一個空的字典
    for i in range(k):
        voteIlabel=labels[sortedDistIndicies[0]]
        classCount[voteIlabel]=classCount.get(voteIlabel,0)+1   #classCount字典儲存每個標籤的數量，Get函式（key,default）若key不存在則以default為預設值建立該key
    sortedClassCount=sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)
    return sortedClassCount[0][0]
# DBset=np.matrix([[1,1]
#                  [1,1.1]
#                  [2,2]
#                  [2,2.1]])
DBset=np.array([[1,1],[1,1.1],[2,2],[2,2.1]])
LB=('甲','甲','乙','乙')                                         #訓練集的Rt(標記)，注意數量要和訓練集大小一致
x=(1.8,2.3)          #元組型別
kp=1
mp=classify0(x,DBset,LB,kp)
print(mp)
###############################繪圖################################
plt.figure(1)
plt.xlabel('x')            #設定x軸標籤
plt.ylabel('y')
plt.xlim([0,5])         #設定x軸顯示範圍
plt.ylim([0,5])
ax=plt.subplot('111')
ax.set_title('KNN')
plt.scatter(DBset[:2,0],DBset[:2,1],c='g')             #'甲'類    DBset[:3,0]需要說一下啊 (:]左開右閉（劃重點）
plt.scatter(DBset[2:,0],DBset[2:,1],c='r')
plt.scatter(x[0],x[1],c='r')                           #這裡不能用[:,1]這種形式，因為是一維的，沒有切片的概念
plt.show()

輸出結果：

乙

統計學習方法 k 近鄰演算法(附簡單模型程式碼)

1. k 近鄰演算法 k近鄰法（k-nearest neighbor， k-NN）是一種基本分類與迴歸方法。 k近鄰法的輸入為例項的特徵向量，對應於特徵空間的點；輸出為例項的類別，可以取多類。 k近鄰法假設給定一個訓練資料集，其中的例項類別已定。分類時，對新的例項，根

K-近鄰演算法的一個簡單例子（二）

接著上一個例子進行拓展，file2matrix（）函式將文件中的資料轉化為記憶體中的矩陣（陣列），autoNorm（）將三列資料歸一化，這裡要注意這裡使用的歸一化方法對於極值點非常敏感，可以考慮其他的方法。datingClassTest()呼叫KNN中的classify0函式

K-近鄰演算法的一個簡單例子

k近鄰演算法思想很簡單，一個類的資料之間距離較近，單純比較距離就好，下面註釋比較清楚，常犯的錯誤也已經標記出來了 import numpy as np import operator from matplotlib import pyplot as plt def class

k-近鄰演算法-機器學習實戰例子說明

演算法概述優點精度高、對異常值不敏感、無資料輸入假定。缺點計算複雜度高、空間複雜度高。試用資料範圍數值型和標稱型工作原理：將新資料的每個特徵與樣本集中資料對應特徵進行比較，計算之間的距離值，選取樣本資料集中前k個最相似的資料。虛擬碼計算

簡單易學的機器學習演算法——K-近鄰演算法

# coding:UTF-8 import cPickle as pickle import gzip import numpy as np def load_data(data_file): with gzip.open(data_file, 'rb') as f: train_set, vali

C++實現的簡單k近鄰演算法（K-Nearest-Neighbour，K-NN）

</#include<map> #include<vector> #include<stdio.h> #include<cmath> #include<cstdlib> #include<algorithm> #include<

《李航：統計學習方法》--- K近鄰演算法(KNN)原理與簡單實現

k近鄰演算法簡單，直觀：給定一個訓練資料集，對新的輸入例項，在訓練集中找到與該例項最鄰近的k個例項，這k個例項的多數屬於某個類，就把該輸入例項分為這個類。如上圖所示，藍色正方形表示一個類別，紅色三角形表示另一個類別，綠色圓圈表示待分類的樣本。按照KNN演

《機器學習實戰》第二章：k-近鄰演算法（1）簡單KNN

收拾下心情，繼續上路。最近開始看Peter Harrington的《Machine Learning in Action》... 的中文版《機器學習實戰》。準備在部落格裡面記錄些筆記。這本書附帶的程式碼和資料及可以在這裡找到。這本書裡程式碼基本是用python寫的

用socket.io實現websocket的一個簡單例子

soc .html www sock 在線 ket log html 簡單例子 http://biyeah.iteye.com/blog/1295196 socket.io的介紹 http://www.cnblogs.com/mazg/p/5467960.html

C語言多線程的一個簡單例子

color oid blog stdlib.h null bsp 等待 creat 多線程　　多線程的一個簡單例子: 　　 #include <stdio.h> #include <stdlib.h> #include <string.h&

netsh interface portproxy的一個簡單例子

get 文檔 let pre interface 簡單例子配置文件 exe CP netsh interface portproxy的微軟幫助文檔地址： https://technet.microsoft.com/zh-cn/library/cc776297(WS.10

使用java實現快速排序的一個簡單例子

fast val rgs 快速實現個數 static void sta public static void main(String[] args) { // 測試排序 Random r = new Random(); int arr[] = new

《機器學習實戰》第二章——k-近鄰演算法——筆記

在看這一章的書之前，在網上跟著博主Jack-Cui的部落格學習過，非常推薦。部落格地址：http://blog.csdn.net/c406495762 《Python3《機器學習實戰》學習筆記（一）：k-近鄰演算法(史詩級乾貨長文)》講述的非常細緻，文字幽默有趣，演算法細

機器學習 k-近鄰演算法

1、使用python匯入資料 from numpy import * def createDataSet(): group=array([[1.1,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return gr

小白python學習——機器學習篇——k-近鄰演算法（KNN演算法）

一、演算法理解一般給你一資料集，作為該題目的資料（一個矩陣，每一行是所有特徵），而且每一組資料都是分了類，然後給你一個數據，讓這個你預測這組資料屬於什麼類別。你需要對資料集進行處理，如：歸一化數值。處理後可以用matplotlib繪製出影象，一般選兩個特徵繪製x，y軸，然後核心是計算出預測點到

機器學習-k-近鄰演算法python實踐【4】

寫在最前面：簡單來說，k-近鄰演算法是用來根據不同的特徵進行分類的一種演算法優點：精度高、對異常值不敏感、無資料輸入假定缺點：計算複雜度高、空間複雜度高適用資料範圍：數值型和標稱型 IDE:Pycharm python版本：3.6 作業系統：macOS Mojave k

機器學習-K近鄰演算法

用例一： from sklearn.neighbors import NearestNeighbors import numpy as np X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]]) nbr

機器學習：K近鄰演算法，kd樹

https://www.cnblogs.com/eyeszjwang/articles/2429382.html kd樹詳解 https://blog.csdn.net/v_JULY_v/article/details/8203674 一、K-近鄰演算法（KNN）概述

機器學習實戰——k-近鄰演算法Python實現問題記錄

準備 kNN.py 的python模組 from numpy import * import operator def createDataSet(): group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])

K近鄰演算法(KNN)原理解析及python實現程式碼

KNN演算法是一個有監督的演算法，也就是樣本是有標籤的。KNN可以用於分類，也可以用於迴歸。這裡主要講knn在分類上的原理。KNN的原理很簡單：放入一個待分類的樣本，使用者指定k的大小，然後計算所有訓練樣本與該樣

K-近鄰演算法的一個簡單例子

相關推薦