Training Shallow and Thin Networks for Acceleration via KD with Conditional Adversarial Networks
這是2017年的一篇文章。在本文之前的監督學習的方法一般是通過最小化確定的損失函式來擬合學生和老師,本文通過cGANs來學習適合的loss,更好的進行知識的遷移。其訓練過程如下:
Discriminator的更新過程如下:
但Discriminator只使用學生和老師的標籤作為loss函式的輸入會讓訓練不穩定且緩慢,為了解決這個問題,作者將Teacher和Student的輸出的概率分佈的vector同時作為loss函式的輸入,需要注意這裡用的是未加負號的Binary Cross-entropy,所以訓練中對(5)式是最大化:
學生網路更新如下:
(7)式中的等式中的負號是為了保留類級知識。
實驗結果:
可以看到本文的方法錯誤率少於KD,且壓縮了七倍的記憶體,五倍的執行速度,且預測分佈和教師很像。
缺點:精度損失有點大,只使用的教師和學生的輸出結果來進行擬合。改進方式可以從讓教師網路的某些層加入到對學生網路的監督中來。
相關推薦
Training Shallow and Thin Networks for Acceleration via KD with Conditional Adversarial Networks
這是2017年的一篇文章。在本文之前的監督學習的方法一般是通過最小化確定的損失函式來擬合學生和老師,本文通過cGANs來學習適合的loss,更好的進行知識的遷移。其訓練過程如下: Discriminator的更新過程如下: 但Discriminator只使
【論文筆記】An Intelligent Fault Diagnosis Method Using: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks
ivar 單位矩陣 作用 一次 一個 http example tps 計算 論文來源:IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS 2016年的文章,SCI1區,提出了兩階段的算法。第一個階段使用Sparse filtering
image-to-image translation with conditional adversarial networks文獻筆記
Image-to-Image Translation with Conditional Adversarial Networks (基於條件gan的影象轉影象) 作者:Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros 全文連結:https
GAN系列:Image-to-Image Translation with Conditional Adversarial Networks
Abstract 1. image-to-image trainslation 存在的兩個問題: 1)many-to-one:將照片對映為edges/segments/semantic labels 2)one-to-many:將labels/sparse user
Image-to-Image Translation with Conditional Adversarial Networks
影象轉換的條件對抗網路不僅學習了從輸入影象到輸出影象之間的對映,也學習了一個用來訓練這個對映的損失函式。使得網路可以很好地應用到傳統上需要不同損失結構的問題上。 影象處理,圖形學,CV的很多問題都可以概括為將輸入影象轉化為相應的輸出影象,文章就是提出了一個針對這些問題的共同框架。C
《Image-to-Image Translation with Conditional Adversarial Networks》論文筆記
論文連結 摘要 我們研究條件對抗網路的目的是將之作為一種圖片到圖片“翻譯”問題的通用的解決方法。這些網路不僅學習了從輸入影象到輸出影象的對映,還學習了訓練這個對映的損失函式。這使得將這個一般方法解決通常需要完全不同的損失函式公式的問題成為了可能。我們證實
Convolutional Neural Networks for Beginners: Practical Guide with Python and Keras
Convolutional Neural Networks for Beginners: Practical Guide with Python and KerasAt this point, we are ready to deal with another type of neural networks,
Decoupled Learning for Conditional Adversarial Networks
文章提出裡在已有的ED+GAN的基礎上,添見一個生成網路,即ED//GAN,網路結構如下, 上圖中左邊為傳統的GAN網路,Enc+Dec相當於生成網路,D為判別網路,構造GAN損失函式,以及生成圖片與輸入的重構誤差(L1損失函式,這種網路結構我們熟悉的有pix2pix,cycl
23.Deep Networks for Saliency Detection via Local Estimation and Global Search
Deep networks for saliency detection via Local Estimation and Global Search 摘要 本文提出了一種將區域性估計和全域性搜尋相結合的顯著性檢測演算法。在區域性估計階段,我們通過使用深度神經網路(DNN
Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference
本部落格參考了微信公眾號“AI晶片演算法”中的原創文章《Google CVPR2018 8bit 量化論文》一文。 1、本文的貢獻 本文主要側重將推斷中的浮點數運算量化為整數運算(Integer-Arithmetic-Only),最終將權重和啟用函式量化為8-bit,
CVPR 2017:See the Forest for the Trees: Joint Spatial and Temporal Recurrent Neural Networks for Video-based Person Re-identification
network 測試 eee 分享 The 因此 進行 最大 變化 [1] Z. Zhou, Y. Huang, W. Wang, L. Wang, T. Tan, Ieee, See the Forest for the Trees: Joint Spatial and
論文閱讀 | Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction
Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction (KDD 2018) 1.主要特點: 通常,一個句子應用一次attention,然後學習最終表
[論文理解]Region-Based Convolutional Networks for Accurate Object Detection and Segmentation
Region-Based Convolutional Networks for Accurate Object Detection and Segmentation 概括 這是一篇2016年的目標檢測的文章,也是一篇比較經典的目標檢測的文章。作者介紹到,現在表現最好的方法非常的複雜,而本文的方法,簡單又容
論文解讀:DeLiGAN: Generative Adversarial Networks for Diverse and Limited Data
前言:DeLiGAN是計算機視覺頂會CVPR2017發表的一篇論文,本文將結合Python原始碼學習DeLiGAN中的核心內容。DeLiGAN最大的貢獻就是將生成對抗網路(GANs)的輸入潛空間編碼為混合模型(高斯混合模型),從而使得生成對抗網路(GANs)在數量有限但具有多樣性的訓練資料上表現出較
Building Fast and Compact Convolutional Neural Networks for Offline HCCR
--pattern recognition 2017 摘要: 像其他的計算機視覺技術一樣,離線的手寫文字識別使用CNN方法取得了很好的效果。但是需要非常複雜的網路才可以取得較好的效果。這樣的網路直觀地看起來計算成本過高,並且需要儲存大量引數,這使得它們在行動式裝置中部署
Waveform Modeling and Generation Using Hierarchical Recurrent Neural Networks for Speech Bandwidth Extension
基於遞階遞迴神經網路的語音訊帶擴充套件的波形建模與生成 作者:凌震華老師;成員:Yang Ai , 顧宇, and Li-Rong Dai 摘要 本文提出了一種基於遞階遞迴神經網路(HRNN)的語音頻寬擴充套件(BWE)的波形建模與生成方法。與傳統的預測寬頻語音波形譜引數的盲式頻帶擴充套件(BWE)
【文章閱讀】【超解像】---Deep laplacian Pyramid Networks for Fast and Accurate Super-Resolution
【文章閱讀】【超解像】–Deep laplacian Pyramid Networks for Fast and Accurate Super-Resolution 期刊論文CVPR2017連結:http://vllab.ucmerced.edu/wlai24/LapSRN/papers
【論文閱讀】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description
【論文閱讀】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description 這篇文章是15年的一篇文章,文章設計了CNN+LSTM的網路結構用於行為識別、影象描述、視訊描述。因為我研究行為
影象隱寫術分析論文筆記:Deep learning for steganalysis via convolutional neural networks
好久沒有寫論文筆記了,這裡開始一個新任務,即影象的steganalysis任務的深度網路模型。現在是論文閱讀階段,會陸續分享一些相關論文,以及基礎知識,以及傳統方法的思路,以資借鑑。 這一篇是Media Watermarking, Security, and Forensi
Region-based Convolutional Networks for Accurate Object Detection and Segmentation----R-CNN論文筆記
一、為什麼提出R-CNN 目標檢測效能停滯不前,效能最好的整合方法又太複雜,所以作者提出了一個既能大幅提升效能,又更簡單的R-CNN。 二、R-CNN的框架 上面的框架圖清晰的給出了R-CNN的目標檢測流程: 1) 輸入測試影象 2) 利用s