人工智慧演算法--猜畫小歌
阿新 • • 發佈:2018-12-16
最近領導讓研究一下猜畫小歌的底層原理,下面是自己總結的,不合適的地方,請大家留言指點,謝謝!
1.簡化圖形檔案:將資料定位並縮放到256x256區域。資料以ndjson格式匯出,其元資料與原始格式相同。
簡化過程是:
1.1.將圖形與左上角對齊,使其最小值為0。
1.2.均勻縮放繪圖,最大值為255。
1.3.以1畫素間距重新取樣所有筆劃。
2.使用Ramer-Douglas-Peucker演算法簡化所有筆劃,epsilon值為2.0
Ramer-Douglas-Peucker演算法:轉下一頁PPT
3.二進位制檔案(.bin)
簡化的圖紙和元資料也以自定義二進位制格式提供,以實現高效壓縮和載入。
4.Numpy點陣圖(.npy)
所有簡化的圖紙都以numpy .npy格式渲染成28x28灰度點陣圖。可以使用np.load()載入這些檔案。這些影象是從簡化資料生成的,但是與圖形邊界框的中心對齊,而不是左上角。
5. Sketch-RNN QuickDraw資料集
該資料還用於訓練Sketch-RNN模型。 Magenta專案中提供了該模型的開源TensorFlow實現(連結到GitHub repo)。您還可以在此Google研究部落格文章中閱讀有關此模型的更多資訊。資料以適合輸入到遞迴神經網路的格式儲存在壓縮的.npz檔案中。
在該資料集中,從每個類別中隨機選擇了75K
鍵 |
型別 |
描述 |
KEY_ID |
64位無符號整數 |
所有圖紙的唯一識別符號。 |
字 |
串 |
提示玩家繪製的類別。 |
認可 |
布林 |
這個詞是否被遊戲識別。 |
時間戳 |
約會時間 |
繪圖建立時。 |
畫畫 |
串 |
表示向量繪圖的JSON陣列 |