1. 程式人生 > >Semi-supervised Segmentation of Optic Cup in Retinal Fundus Images Using Variational Autoencoder 論文筆記

Semi-supervised Segmentation of Optic Cup in Retinal Fundus Images Using Variational Autoencoder 論文筆記

str 很好 流程 Coding 測試 eat www tin nal

MICCAI 2017年論文

Overview:

視杯視盤精確分割後,就可以計算杯盤比了,杯盤比是青光眼疾病的主要manifestation。以往的方法往往采用監督學習的方法,這樣需要大量的精確像素級別的標定。而這些標定非常費時間。所以本文為了解決這個問題,提出了一個半監督學習的方法,從一堆沒有標簽的數據中繼承一些相似的特征,然後根據少量的有標簽的圖像訓練一個分割模型。具體地,首先采用variational autoencoder從沒有標簽的圖像中學習生成模型的參數,這樣,這個訓練好的生成模型提供了一個很好的feature embedding,在這個latent feature space中,觀測圖像就會聚成一簇一簇的。然後,將feature embedding與segmentation autoencoder相結合。這個segmentation autoencoder是在少量的標簽數據集上訓練得到的,可以獲得視杯的分割。

創新點:將生成學習用於半監督的分割方法中。

基本流程:

(image auto-encoder, Generative Variational Autoencoder, GVAE)生成模型學習:用variational autoencoder學習生成模型的參數,autoencoder包含兩個部分,一個是將圖像映射到因變量空間,用隱變量z表示圖像,叫做encoder network。一個是用隱空間變量對圖像進行重構,叫做decoder network。

(image segmentation) segmentation variational autoencoder (SVAE)也包含兩個部分:一個是segmentation encoder,學習分割模型的因變量表示V,一個是segmentation decoder,將分割模型的因變量表示x作為輸入,學習分割的參數,輸出segmentation mask。為了利用image auto-encoder從未標記數據中獲得的信息,SVAE不僅需要對segmentation mask進行重構,還需要對從GVAE中學到的latent representation x進行重構。所以,loss function為:

技術分享

實驗:

數據:EyePACS, 12000張眼底圖像。從中選600張進行了標記。600張中400張用來做訓練,200張用來做測試。實驗結果如下:

技術分享

第一列:訓練集中使用的圖像的數量,相比於Unet有一個百分點的提升。而本身所使用的segmentation autoencoder相比於Unet,使用更少的數據進行訓練的時候,分割精度也比Unet高,說明本身所使用的SVAE的泛化能力要優於Unet的。

最後,看論文Auto-Encoding Variational Bayes,code

Semi-supervised Segmentation of Optic Cup in Retinal Fundus Images Using Variational Autoencoder 論文筆記