【GAN ZOO翻譯系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用於監督和半監督學習的GAN

Jost Tobias Springenberg 弗萊堡大學 79110 Freiburg, Germany [email protected] 原文連結https://arxiv.org/abs/1511.06390v2，引用請註明出處

摘要

本文提出了一種從未標記或部分標記的資料中學習判別分類器的方法。方法基於客觀函式，該函式在觀察到的示例與其預測的分類類別分佈之間交換互資訊，與生成模型的分類器的魯棒性進行對抗。得到的演算法可以被解釋為生成對抗網路（GAN）框架的自然概括，或者被解釋為正則化資訊最大化（RIM）框架的擴充套件，用於針對最優對手進行魯棒分類。作者憑經驗評估他們的方法-作者將分類生成對抗網路（CatGAN）用於合成數據以及具有挑戰性的影象分類任務，並陳述了該分類器的魯棒性。作者進一步定性地評估由判別分類器學習的對抗生成器生成的樣本的保真度，並將CatGAN目標和判別性聚類演算法（例如RIM）之間進行連線。

1、引言

從未標記或僅部分標記的資料中學習非線性分類器是機器學習中長期存在的問題。從未標記資料中學習的前提是，訓練樣本中存在的結構包含可用於推斷未知標籤的資訊。也就是說，在無監督學習中，假設輸入分佈 $p(x)$ 包含關於 $p$

( y ∣ x ) p(y|x)

p (y ∣ x)

的資訊，其中

y\in\{1,...k\}

表示未知標籤。通過利用來自資料分佈的標記和未標記的樣本，人們希望學習得到這種共有結構的表示。這樣的表示可以僅使用少數標記樣本來生成資料的部分分佈，用於幫助分類器的訓練。此外，無監督的資料分類是用於發現具有未知類結構的資料集中的組的常用工具。

傳統上，這個任務被形式化為群集分配問題，可以使用大量經過充分研究的演算法。這些可以分為兩種型別：
（1）生成聚類方法，如高斯混合模型，k均值和密度估計演算法，它們直接嘗試對資料分佈 $p(x)$ 或其幾何性質進行建模;
（2）判別聚類方法，如最大邊緣聚類（MMC）（徐等，2005）或正則化資訊最大化（RIM）（Krause等，2010)，其目的是通過一些分類機制將未標記的資料直接分組到已經被良好區分的類別，而無需明確地對 $p(x)$ 進行建模。
雖然後一種方法更直接地對應於學習類別分離的目標（而不是樣本類別或樣本中心），但它們很容易過度擬合數據中的虛假相關性，特別是當與強大的非線性分類器（如神經網路）結合使用時。

最近，神經網路社群已經探索了用於無監督和半監督學習任務的各種方法。這些方法通常訓練引數化的生成模型，例如，通過深度玻爾茲曼機（如Salakhutdinov&Hinton，2009或Goodfellow等，2013）或者通過前饋神經網路（如，Bengio等，2014或Kingma等，2014）或訓練自動編碼器網路（如，Hinton和Salakhutdinov，2006或Vincent等，2008）。因為他們通過重建輸入樣本明確地模擬資料分佈，所有這些模型都與聚類生成方法相關，並且通常僅用於預訓練分類網路。這種基於重建的學習方法的一個問題是，通過構造，他們試圖學習保留輸入樣本中存在的所有資訊的表示。這種完美重建的目標通常與學習分類器的目標相反，因為分類器是對 $p(y|x)$ 進行建模，因此只希望保留預測所必需的資訊（並對其他不重要的細節具有魯棒性）。

本文的分類生成對抗網路（CatGAN）框架的想法是結合生成和判別的角度。特別地，學習判別性神經網路分類器 $D$ ，其最大化輸入 $x$ 和標籤 $y$ 之間的互資訊（如通過條件分佈 $p(y|x,D)$ 預測的）。對於k個未知類別，為了幫助這些分類器更好的發現潛在的資料，作者將分類器的魯棒性施加到對抗性生成模型產生的示例，該模型試圖欺騙分類器接受虛假輸入示例。

本文的其餘部分安排如下：在介紹新方法之前，將簡要回顧一節中的生成對抗網路框架；然後，將CatGAN的目標推導為GAN框架的擴充套件，然後在MNIST（LeCun等，1989）和CIFAR-10（Krizhevsky＆Hinton，2009）資料集上進行實驗。

2、生成對抗網路

Goodfellow等（2014）提出了生成對抗網路（GAN）框架。他們通過一個目標函式訓練生成模型，該目標函式在一個鑑別器 $D$ 和一個生成器 $G$ 之間實現一個雙人zero sum遊戲。判別器旨在分辨真假輸入資料，生成器 $G$ 用於生成“愚弄”判別器的輸入資料（來自噪聲）。然後可以如下直觀地描述生成器和判別器所玩的“遊戲”。在每個步驟中，生成器從隨機噪聲中產生一個樣本，該樣本有可能欺騙判別器。然後，判別器被呈現一些真實資料樣本，以及由生成器產生的示例，其任務是將它們分類為“真實的”或“假的”。之後，判別器被訓練以區分正確的分類，並且生成器被訓練以生成愚弄鑑別器的示例。然後更新兩個模型並開始下一個”遊戲“週期。

該過程可以如下形式化。設 $\mathcal X= {x_1 ,. . . x_N }$ 是 $n$ 維的真實資料輸入（即 ${x∈R^n}$ ）。設 $D$ 表示上述判別函式， $G$ 表示生成函式。即 $G$ 將隨機向量 $z∈R^ Z$ 對映到 $\hat x = G(z)$ ，並且用判別器 $D$ 來計算樣本 $x$ 存在於資料集 $X$ 中的概率： $p(y = 1 | x，D)=\frac 1 {1+e^{-D(x)}}$ 。

GAN的目標函式如下：
$\min_G \max_D \mathbb E_{x\sim\mathcal X}[\log p(y=1|x,D)]+\mathbb E _{z\sim P(z)}[\log (1-p(y=1|G(z)，D))].\tag{1}$

其中 $P(z)$ 是一個任意的噪聲分佈，在不失一般性的情況下，在本文中假設是的均勻分佈 $P(z_i )=\mathcal U(0,1)$ 。如果生成器和判別器都是可微函式（例如深度神經網路），則可以通過交替隨機梯度下降（SGD）步驟對目標函式 $(1)$ 進行訓練，有效地實現上述兩個玩家的遊戲。

3 類別生成的對抗網路（CATGANS）

建立在第2章的基礎上，現在將推匯出用於無監督和半監督學習的分類生成對抗網路（CatGAN）的目標函式。作者首先將自己侷限於無監督設定，這可以通過將GAN框架推廣到多個類來獲得，並在3.3章中介紹了半監督學習。應該注意的是，從正則化資訊最大化（RIM）的角度出發，可以等效地推匯出CatGAN模型，如附錄中所述（注：附錄未翻譯），且具有相同的結果。

3.1 問題設定

和以前一樣，令 ${\mathcal X= x_1 ,. . . x _N}$ 是未標記的資料集。考慮無監督地學習判別分類器 $D$ 的問題，使得 $D$ 能將資料分類為先驗選擇的類別 $K$ 。此外，需要 $D(x)$ 來產生到類別的條件概率分佈，即 $\sum _{k=1}^K p(y = k | x，D)= 1$ 然後學習的目標是訓練概率分類器 $D$ ，其類別分配滿足擬合優度的標準。值得注意的是，由於對示例的真實類分佈未知，不得不求助於中間度量來判斷分類器效能，而不是僅僅最小化負對數似然之類的準則。具體而言，在下文中，作者將總是優先選擇 $D$ ，對於給定樣本 $x$ 的條件類分佈 $p(y|x,D)$ 具有高確定性，並且對所有的 $k$ ，邊際類分佈 $p(y|D)$ 接近於某些先驗分佈 $P(y)$ 。在後文中，將始終假設一個均勻分佈的先驗類別，即期望 $\mathcal X$ 中每個類別的樣本數對於所有 $k$ 是相同的：
$∀k,k'\in K:p(y = k|D)= p(y = k ' | D).$

關於這個問題的第一個觀點是它自然可以被認為是“軟的”或概率叢集分配任務。因此，原則上可以通過概率聚類演算法來解決，例如正則化資訊最大化（RIM）（Krause等，2010）或相關的熵最小化（Grandvalet和Bengio，2005），或早期關於模擬目標的無監督分類的工作（Bridle等人，1992）。所有這些方法都有過度擬合數據中虛假相關性的趨勢，作者的目標是通過將鑑別器與對抗性生成模型配對來緩解這個問題，使其變得魯棒。這種方法可以被理解為RIM的強大擴充套件，這種對抗提供了自適應正則化機制。這種關係在附錄中明確說明。

可以做出的一個稍微明顯但重要的第二個觀點是標準GAN目標不能直接用於解決所描述的類別分配問題。這樣做的原因是同時優化公式 $(1)$ 確實產生了一個有辨別力的分類器 $D$ ，這個分類器能區分訓練資料與生成資料，即這個分類器用於確定給定的樣本 $x$ 是否屬於 $\mathcal X$ 。原則上，作者希望能夠對資料分佈建模的分類器也可以學習特徵表示（例如，在神經網路的情況下， $D$ 的最後一層中的隱藏表示）對於在第二步中的提取類別是有用的（例如通過判別模型進行聚類）。然後，有必要認識到函式 $D$ 執行二元分類任務的方法（區分真實樣本和假樣本）在GAN框架中不受限制，因此分類器將主要關注輸入特徵，這些輸入特性尚未由生成器正確建模。反過來，這些特徵不一定與想要分類資料的目標一致。在最壞的情況下，它們可以檢測源自生成器資料中的噪聲。

儘管存在這些問題，但是存在一種原則但簡單的擴充套件GAN框架的方式，使得判別器可用於多類分類。為了實現這一點，作者考慮改變一下GAN框架後面的兩個玩家遊戲的規則（這將在下一節中形式化）：不要求

【GAN ZOO翻譯系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用於監督和半監督學習的GAN

摘要

1、引言

2、生成對抗網路

3 類別生成的對抗網路（CATGANS）

3.1 問題設定

【GAN ZOO翻譯系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用於監督和半監督學習的GAN

【GAN ZOO翻譯系列】基於能量的生成對抗網路 Energy-Based Generative Adversarial Networks

【GAN ZOO翻譯系列】InfoGAN： Interpretable Representation Learning by Information Maximizing GAN

【GAN ZOO翻譯系列】s2GAN：使用樣式和結構對抗式網路的生成影象建模

【GAN ZOO閱讀系列】NONSUPERVISED REPRESENTATION LEARNING WITH DCGAN 使用深度卷積生成對抗網路的無監督的表示學習

【GAN ZOO閱讀系列】UNSUPERVISED REPRESENTATION LEARNING WITH DCGAN 使用深度卷積生成對抗網路的無監督的表示學習

【BAT面試題系列】面試官：你了解樂觀鎖和悲觀鎖嗎？

【GAN ZOO翻譯】StackGAN：Text to Photo-realistic Image Synthesis with Stacked GAN 使用堆疊的GAN從文字中生成照片一樣逼真的圖片

1.3.2【Deep Learning翻譯系列】Activation Functions 啟用函式

1.3.1 【Deep Learning翻譯系列】Neural Network Overview神經網路概覽

1.2.11 【Deep Learning翻譯系列】Explanation of Logistic Regression Cost Function 對數機率迴歸代價函式的說明

1.2.9&1.2.10 【Deep Learning翻譯系列】Logistic Regression Gradient Descent 對數機率迴歸的梯度下降

1.2.7&1.2.8 【Deep Learning翻譯系列】Derivatives with a Computation Graph 採用計算圖計算微分

【數據庫系列】MySql中的select的鎖表範圍

【epub.js|翻譯|原創】開源中間件epub.js的使用及其中文文檔

【ASP.NET MVC系列】淺談MVC

【APS.NET 框架系列】淺談ASP.NET 框架

【ASP.NET MVC系列】淺談表單和HTML輔助方法

【腫瘤預測模型系列】如何在R軟體中求一致性指數( Harrell'concordance index:C-index)？

【中文分詞系列】 8 更好的新詞發現演算法

【GAN ZOO翻譯系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用於監督和半監督學習的GAN

摘要

1、引言

2、生成對抗網路

3 類別生成的對抗網路（CATGANS）

3.1 問題設定

相關推薦