1. 程式人生 > >大規模影象分類器的演化-Large-Scale Evolution of Image Classifiers-讀後雜談

大規模影象分類器的演化-Large-Scale Evolution of Image Classifiers-讀後雜談

答辯完也畢業了,簽證正在辦理之中,基本也不去學校了,這連續好幾天都是早上起的晚隨便吃點,下午5點左右準時開始給老婆做飯,吃了飯主動洗涮,老婆需要散步就陪著一會。好了不說這些了,說一下我最近閱讀的這篇文章吧,deepmind團隊的文章,文章標題已經是Large-Scale Evolution of Image Classifiers,被ICML17接受了,文章可以在arxiv上下載到。我就說一下我的感受吧:

1:解決的主要問題其實在abstract中寫的很清楚了,主要是解決神經網路的結構設計問題,我們都知道對於一個特定的任務:如果我們想用神經網路來解決的話,其最優的結構往往不好找到,我們平時說的調參就是這個意思,大家都知道不好調參。

2:這個文章解決的問題是使用演化的方法來調參,為什麼使用演化的方法呢,我覺得我就不說了,我2年前就很想做這種工作,去年年底提交到了某個if很高的cs學科的期刊,後來被reject了一次,再後來老闆讓我修改了一下繼續提交,並且要求換了個ae,最終意見估計這個月底出來吧。

3:這篇文章的大概意思是想證明一下,使用演化演算法做出來的神經網路結構,在影象分類上不會低於人工精心設計的結構,並且最後結果也給了驗證。

4:在該文章中一共使用了1000個大小的種群,其中使用了250臺機器,每個機器稱為worker,使用tournament selection的方法來選擇一個好的個體,然後在這個個體之上進行變異,記住:這個文章只能夠沒使用crossover,並且tournament selection的時候直接把那個不好的個體給kill掉了

5:基本思路就是這樣,但是作者還驗證了幾個想法:種群個數小的時候,容易陷入local minima,訓練步驟不夠的話也是效能不好。其實這些都是在演化計算中很obvious的問題,不知道為何作者要做個analysis,可能這個文章是給ML community的人看的吧。

6:此外,個體使用的都是BP來進行訓練,對應分類結果為fitness的。在mutation的時候,儘量的整合父類的圈中連線,此外,它也把BP的學習率加入了演化過程中。同時,演化的是CNN的結構,具體的基本單元作者給出而一個list,從list中來選擇的

7:從最簡單的結構開始,使用一種graphic的方式來encode,說實話我沒看明白具體怎麼在做。

8:總結就是:這種思路很obvious,但是很多人都沒做這是因為沒有人有這種資源。我們從academy的角度來做的話,應該考慮如何高效的representation,以及optimization。其實representation的問題作者也提到了。這個方向不錯,我覺得可以做很多東西,如果我的文章被接受了就爽了。