1. 程式人生 > >將Mnist手寫數字庫轉化為圖片形式 和標籤形式

將Mnist手寫數字庫轉化為圖片形式 和標籤形式

Mnist 資料檔案有兩種,一種是圖片檔案,一種是標籤檔案,那麼如何把他們解析出來呢?

1)解析圖片檔案

  可以看出在train-images.idx3-ubyte中,第一個數為32位的整數(魔數,圖片型別的數),第二個數為32位的整數(圖片的個數),第三和第四個也是32為的整數(分別代表圖片的行數和列數),接下來的都是一個位元組的無符號數(即畫素,值域為0~255),因此,我們只需要依次獲取魔數和圖片的個數,然後獲取圖片的長和寬,最後逐個畫素讀取就可以了。

(2)解析標籤檔案

  

  可以發現,與上面的非常相似,只不過這裡每一個位元組變成了標籤而已(標籤大小為0~9)
  如何使用python解析資料呢? 首先需要安裝python的圖形處理庫PIL,這個庫支援畫素級別的影象處理,對於學習數字影象處理有很大的幫助。安裝完成之後,就可以進行影象的解析了。看一下程式碼:

from PIL import Image
import struct


def read_image(filename):
    f = open(filename,'rb')
    index = 0
    buf = f.read()
    f.close()
    magic, images, rows, columns = struct.unpack_from('>IIII' , buf , index)
    index += struct.calcsize('>IIII')

    for i in range(images):
        image 
= Image.new('L', (columns, rows)) for x in range(rows): for y in range(columns): image.putpixel((y, x), int(struct.unpack_from('>B', buf, index)[0])) index += struct.calcsize('>B') print('save ' + str(i) + 'image') image.save(
'E:/Mnist/' + str(i) + '.png') def read_label(filename, saveFilename): f = open(filename, 'rb') index = 0 buf = f.read() f.close() magic, labels = struct.unpack_from('>II' , buf , index) index += struct.calcsize('>II') labelArr = [0] * labels for x in range(labels): labelArr[x] = int(struct.unpack_from('>B', buf, index)[0]) index += struct.calcsize('>B') save = open(saveFilename, 'w') save.write(','.join(map(lambda x: str(x), labelArr))) save.write('\n') save.close() print('save labels success') if __name__ == '__main__': read_image('E:/Python/t10k-images.idx3-ubyte') read_label('E:/Python/t10k-labels.idx1-ubyte', 'E:/Mnist_Label/label.txt')

程式的具體流程為:

  首先開啟檔案,然後分別讀取魔數,圖片個數,以及行數和列數,在struct中,可以看到,使用了’>IIII’,這是什麼意思呢?意思就是使用大端規則,讀取四個整形數(Integer),如果要讀取一個位元組,則可以用’>B’(當然,這裡用沒用大端規則都是一樣的,因此只有兩個或兩個以上的位元組才有用)。

   什麼是大端規則呢?不懂的可以百度一下,這個不再贅述(http://baike.baidu.com/link?url=Bgg8b0vRr3b_SeGyOl8U4DmAbIQT9swGuNtD_21ctEI_NliqsQ-mKF73YT90EILF2EQy50mEua_M4z6Cma3rmK)

引自部落格:

原文:https://blog.csdn.net/u014046170/article/details/47445919

最後效果: