機器學習實戰例項之手寫數字識別（KNN、python3）

阿新 • • 發佈：2019-01-03

from numpy import *
from os import listdir
import operator

def img2Vector(filename):
    returnVecter = zeros((1,1024))
    fr = open(filename)
    for i in range(32):
        linestr = fr.readline()
        for j in range(32):
            returnVecter[0,32*i+j] = int(linestr[j])
    return returnVecter

def classify0(inX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0]
    diffMat = tile(inX, (dataSetSize,1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()
    classCount={}
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
    sortedClassCount = sorted(classCount.items(),    key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]
def handwritingClassTest():
    hwLabels = []
    trainingFileList = listdir('trainingDigits')           #load the training set
    m = len(trainingFileList)
    trainingMat = zeros((m,1024))
    for i in range(m):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)
        trainingMat[i,:] = img2Vector('trainingDigits/%s' % fileNameStr)
    testFileList = listdir('testDigits')        #iterate through the test set
    errorCount = 0.0
    mTest = len(testFileList)
    for i in range(mTest):
        fileNameStr = testFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        vectorUnderTest = img2Vector('testDigits/%s' % fileNameStr)
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 3)
        print ("the classifier came back with: %d, the real answer is: %d" % (classifierResult, classNumStr))
        if (classifierResult != classNumStr): errorCount += 1.0
    print ("\nthe total number of errors is: %d" % errorCount)
    print ("\nthe total error rate is: %f" % (errorCount/float(mTest)))

機器學習實戰例項之手寫數字識別（KNN、python3）

from numpy import * from os import listdir import operator def img2Vector(filename): returnVecter = zeros((1,1024)) fr = open(fil

機器學習-實戰-入門-MNIST手寫數字識別

機器學習--手寫數字識別（KNN、決策樹）

KNN 及決策樹演算法為監督學習中的兩種簡單演算法。 KNN KNN演算法（鄰近演算法）的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類別，則該樣本也屬於這個類別，並具有這個類別上樣本的特性。歐式距離的計算公式: 假設每個樣本有兩個特徵值，如 A

C++從零實現深度神經網路之六——實戰手寫數字識別（sigmoid和tanh）

本文由@星沉閣冰不語出品，轉載請註明作者和出處。之前的五篇部落格講述的內容應該覆蓋瞭如何編寫神經網路的大部分內容，在經過之前的一系列努力之後，終於可以開始實戰了。試試寫出來的神經網路怎麼樣吧。一、資料準

100天搞定機器學習|day39 Tensorflow Keras手寫數字識別

提示：建議先看day36-38的內容 TensorFlow™ 是一個採用資料流圖（data flow graphs），用於數值計算的開源軟體庫。節點（Nodes）在圖中表示數學操作，圖中的線（edges）則表示在節點間相互聯絡的多維資料陣列，即張量（tensor）。它靈活的架構讓你可以在多種平臺上展開計算，

基於opencv的手寫數字識別（MFC,HOG,SVM）

因為本程式是提取HOG特徵，使用SVM進行分類的，所以大概瞭解下HOG的一些知識，其中我覺得怎麼計算影象HOG特徵的維度會對程式瞭解有幫助關於HOG，我們可以參考： http://gz-ricky.blogbus.com/logs/85326

機器學習實戰k近鄰演算法(kNN)應用之手寫數字識別程式碼解讀

from numpy import * from os import listdir import operator import time #k-NN簡單實現函式 def classify0(inX,dataSet,labels,k): #求出樣本集的行數，也就是labels標籤的數目

機器學習框架ML.NET學習筆記【4】多元分類之手寫數字識別

一、問題與解決方案通過多元分類演算法進行手寫數字識別，手寫數字的圖片解析度為8*8的灰度圖片、已經預先進行過處理，讀取了各畫素點的灰度值，並進行了標記。其中第0列是序號（不參與運算）、1-64列是畫素值、65列是結果。我們以64位畫素值為特徵進行多元分類，演算法採用SDCA最大熵分類演算法。

各種機器學習方法（線性迴歸、支援向量機、決策樹、樸素貝葉斯、KNN演算法、邏輯迴歸）實現手寫數字識別並用準確率、召回率、F1進行評估

本文轉自：http://blog.csdn.net/net_wolf_007/article/details/51794254 前面兩章對資料進行了簡單的特徵提取及線性迴歸分析。識別率已經達到了85%，完成了數字識別的第一步：資料探測。這一章要做的就各

TensorFlow學習筆記(二)：手寫數字識別之多層感知機

在【TensorFlow學習筆記(一)：手寫數字識別之softmax迴歸】中：我使用softmax迴歸演算法識別mnist資料集的手寫數字，在我機器上的mnist測試集上最好結果是 92.9% 。

tensorflow 基礎學習五：MNIST手寫數字識別

truncate averages val flow one die correct 表示 data MNIST數據集介紹： from tensorflow.examples.tutorials.mnist import input_data # 載入MNIST數據集，

新手上手Tensorflow之手寫數字識別應用（3）

本系列為應用TensorFlow實現手寫數字識別應用的全過程的程式碼實現及細節討論。按照實現流程，分為如下幾部分： 1. 模型訓練並儲存模型 2. 通過滑鼠輸入數字並儲存 2. 影象預處理 4. 讀入模型對輸入的圖片進行識別本文重點討論影象預處理的問題。所謂的影象預處理，

新手上手Tensorflow之手寫數字識別應用（2）

本系列為應用TensorFlow實現手寫數字識別應用的全過程的程式碼實現及細節討論。按照實現流程，分為如下幾部分： 1. 模型訓練並儲存模型 2. 通過滑鼠輸入數字並儲存 2. 影象預處理 4. 讀入模型對輸入的圖片進行識別本文重點討論模型的儲存以及讀入問題。關於Tens

新手上手Tensorflow之手寫數字識別應用（1）

學深度學習有一段時間了，各種演算法研究一通，什麼CNN啦，RNN啦，LSTM啦，RCNN啦，各種論文看了一堆。看沒看懂且不說（心虛。。），回來我想把訓練的模型看看實際效果的時候，才發現TensorFlow的好多基本功能還不會。好吧，還是拿著Mnist資料集搞一波手寫數字識別的全流程吧！涉

tensorflow實戰：MNIST手寫數字識別的優化2-代價函式優化，準確率98%

最簡單的tensorflow的手寫識別模型，這一節我們將會介紹其簡單的優化模型。我們會從代價函式，多層感知器，防止過擬合，以及優化器的等幾個方面來介紹優化過程。 1.代價函式的優化：我們可以這樣將代價函式理解為真實值與預測值的差距，我們神經

K-近鄰演算法之手寫數字識別系統

定義將影象轉換為向量函式 # 匯入程式所需要的模組 import numpy as np import operator from os import listdir 讀取檔案 def img2vector(filename): returnVect = np.zero

卷積神經網路之手寫數字識別應用MNISTCNN

一、TensorFlow環境安裝，及準備（ubuntu 環境）1、安裝python、pip#sudo apt-get install python-pip python-dev2、臨時更換pip源，使用國內源保證下載速度#sudo pip install -i https:/

kNN之手寫數字識別

answer style dataset 解析所表讀取 tile span k-近鄰 import numpy as np # listdir()列出給定目錄的文件名 from os import listdir import operator #

MNIST手寫數字識別（二）幾種模型優化方式介紹

本篇的主要內容有：動態衰減法設定可變學習率為損失函式新增正則項滑動平均模型介紹為了讓MNIST數字識別模型更準確，學習幾種常用的模型優化手段：學習率的優化學習率的設定一定程度上也會影響模型的訓練，如果學習率過小，那麼將會經過很長時間才會收斂到想要

MNIST手寫數字識別（三）應用優化

本篇的主要內容應用三種優化方式，對之前的模型進行優化介紹一些在程式中用到的函式學習於《TensorFlow實戰Google深度學習框架》一書程式相比於第一次的簡單邏輯迴歸模型，這一次的調整了網路結構，添加了一個500個節點的隱藏層，在結構中，設定了

機器學習實戰例項之手寫數字識別（KNN、python3）

相關推薦