將Mnist手寫數字庫轉化為圖片形式和標籤形式

阿新 • • 發佈：2018-11-07

Mnist 資料檔案有兩種，一種是圖片檔案，一種是標籤檔案，那麼如何把他們解析出來呢？

（1）解析圖片檔案

　　可以看出在train-images.idx3-ubyte中，第一個數為32位的整數（魔數，圖片型別的數），第二個數為32位的整數（圖片的個數），第三和第四個也是32為的整數（分別代表圖片的行數和列數），接下來的都是一個位元組的無符號數（即畫素，值域為0~255），因此，我們只需要依次獲取魔數和圖片的個數，然後獲取圖片的長和寬，最後逐個畫素讀取就可以了。

（2）解析標籤檔案

　　可以發現，與上面的非常相似，只不過這裡每一個位元組變成了標籤而已（標籤大小為0~9）
　　如何使用python解析資料呢? 首先需要安裝python的圖形處理庫PIL，這個庫支援畫素級別的影象處理，對於學習數字影象處理有很大的幫助。安裝完成之後，就可以進行影象的解析了。看一下程式碼：

from PIL import Image
import struct


def read_image(filename):
    f = open(filename,'rb')
    index = 0
    buf = f.read()
    f.close()
    magic, images, rows, columns = struct.unpack_from('>IIII' , buf , index)
    index += struct.calcsize('>IIII')

    for i in range(images):
        image  
= Image.new('L', (columns, rows))
        for x in range(rows):
            for y in range(columns):
                image.putpixel((y, x), int(struct.unpack_from('>B', buf, index)[0]))
                index += struct.calcsize('>B')

        print('save ' + str(i) + 'image')
        image.save( 
'E:/Mnist/' + str(i) + '.png')


def read_label(filename, saveFilename):
    f = open(filename, 'rb')
    index = 0
    buf = f.read()
    f.close()
    magic, labels = struct.unpack_from('>II' , buf , index)
    index += struct.calcsize('>II')
    labelArr = [0] * labels
    for x in range(labels):
        labelArr[x] = int(struct.unpack_from('>B', buf, index)[0])
        index += struct.calcsize('>B')
        save = open(saveFilename, 'w')
        save.write(','.join(map(lambda x: str(x), labelArr)))
        save.write('\n')
        save.close()
        print('save labels success')


if __name__ == '__main__':
     read_image('E:/Python/t10k-images.idx3-ubyte')
    read_label('E:/Python/t10k-labels.idx1-ubyte', 'E:/Mnist_Label/label.txt')

程式的具體流程為：

　　首先開啟檔案，然後分別讀取魔數，圖片個數，以及行數和列數，在struct中，可以看到，使用了’>IIII’，這是什麼意思呢？意思就是使用大端規則，讀取四個整形數（Integer），如果要讀取一個位元組，則可以用’>B’（當然，這裡用沒用大端規則都是一樣的，因此只有兩個或兩個以上的位元組才有用）。

　　什麼是大端規則呢？不懂的可以百度一下，這個不再贅述（http://baike.baidu.com/link?url=Bgg8b0vRr3b_SeGyOl8U4DmAbIQT9swGuNtD_21ctEI_NliqsQ-mKF73YT90EILF2EQy50mEua_M4z6Cma3rmK）

引自部落格：

原文：https://blog.csdn.net/u014046170/article/details/47445919

最後效果：

將Mnist手寫數字庫轉化為圖片形式和標籤形式

將Mnist手寫數字庫轉化為圖片形式和標籤形式

Tensorflow實踐 mnist手寫數字識別

tensorflow 基礎學習五：MNIST手寫數字識別

Caffe的運行mnist手寫數字識別

MNIST手寫數字圖片識別（線性回歸、CNN方法的手工及框架實現）（未完待續）

北大人工智慧網課攻略[2]:mnist手寫數字分類，並測試自己的手寫體

MNIST手寫數字識別——CNN

Tensorflow之MNIST手寫數字識別：分類問題（1）

Tensorflow之MNIST手寫數字識別：分類問題（2）

基於Keras mnist手寫數字識別---Keras卷積神經網路入門教程

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

【AI實戰】訓練第一個AI模型：MNIST手寫數字識別模型

TensorFlow筆記（1）非線性迴歸、MNIST手寫數字識別

MNIST手寫數字資料集的讀取，基於python3

使用LeNet-5實現mnist手寫數字分類識別 TensorFlow

Mnist手寫數字資料集softmax識別

神經網路實現Mnist手寫數字識別筆記

MNIST手寫數字識別---My way of AI 19

tensorflow實戰：MNIST手寫數字識別的優化2-代價函式優化，準確率98%

Tensorflow案例5：CNN演算法-Mnist手寫數字識別

將Mnist手寫數字庫轉化為圖片形式 和標籤形式

相關推薦

將Mnist手寫數字庫轉化為圖片形式和標籤形式