1. 程式人生 > >人工智慧演算法--猜畫小歌

人工智慧演算法--猜畫小歌

最近領導讓研究一下猜畫小歌的底層原理,下面是自己總結的,不合適的地方,請大家留言指點,謝謝!

1.簡化圖形檔案:將資料定位並縮放到256x256區域。資料以ndjson格式匯出,其元資料與原始格式相同。

簡化過程是:

1.1.將圖形與左上角對齊,使其最小值為0

1.2.均勻縮放繪圖,最大值為255

1.3.1畫素間距重新取樣所有筆劃。

2.使用Ramer-Douglas-Peucker演算法簡化所有筆劃,epsilon值為2.0

  Ramer-Douglas-Peucker演算法:轉下一頁PPT

3.二進位制檔案(.bin

簡化的圖紙和元資料也以自定義二進位制格式提供,以實現高效壓縮和載入。

4.Numpy點陣圖(.npy

所有簡化的圖紙都以numpy .npy格式渲染成28x28灰度點陣圖。可以使用np.load()載入這些檔案。這些影象是從簡化資料生成的,但是與圖形邊界框的中心對齊,而不是左上角。

5. Sketch-RNN QuickDraw資料集

該資料還用於訓練Sketch-RNN模型。 Magenta專案中提供了該模型的開源TensorFlow實現(連結到GitHub repo)。您還可以在此Google研究部落格文章中閱讀有關此模型的更多資訊。資料以適合輸入到遞迴神經網路的格式儲存在壓縮的.npz檔案中。

在該資料集中,從每個類別中隨機選擇了75K

樣本(70K訓練,2.5K驗證,2.5K測試),使用ε引數2.0進行RDP線簡化處理。每個類別都將儲存在自己的.npz檔案中,例如cat.npz  

型別

描述

KEY_ID

64位無符號整數

所有圖紙的唯一識別符號。

提示玩家繪製的類別。

認可

布林

這個詞是否被遊戲識別。

時間戳

約會時間

繪圖建立時。

畫畫

表示向量繪圖的JSON陣列