1. 程式人生 > >騰訊AI Lab開源業內最大規模多標籤影象資料集(附下載地址)

騰訊AI Lab開源業內最大規模多標籤影象資料集(附下載地址)

640?wx_fmt=jpeg

參加 2018 AI開發者大會,請點選 ↑↑↑


今日(10 月 18 日),騰訊AI Lab宣佈正式開源“Tencent ML-Images”專案。該專案由多標籤影象資料集 ML-Images,以及業內目前同類深度學習模型中精度最高的深度殘差網路 ResNet-101 構成。


該開源專案的主要內容包括:


1、ML-Images 資料集的全部影象 URLs,以及相應的類別標註。出於原始影象版權的考慮,此次開源將不直接提供原始影象,使用者可利用我們提供的下載程式碼和 URLs 自行下載影象。


2、ML-Images 資料集的詳細介紹,包括影象來源,影象數量,類別數量,類別的語義標籤體系,標註方法,以及影象的標註數量等統計量。


3、完整的程式碼和模型。我們提供的程式碼涵蓋從影象下載,影象預處理,基於 ML-Images 的預訓練,基於 ImageNet 的遷移學習,到基於訓練所得模型的影象特徵提取的完整流程。該專案提供了基於小資料集的訓練示例,以方便使用者快速體驗我們的訓練流程。該專案還提供了非常高精度的 ResNet-101 模型(在單標籤基準資料集 ImageNet 的驗證集上的 top-1 精度為 80.73%)。使用者可根據自身需求,隨意選用該專案的程式碼或模型。


以深度神經網路為典型代表的深度學習技術已經在很多領域充分展現出其優異的能力,尤其是計算機視覺領域,包括影象和視訊的分類、理解和生成等重要任務。然而,要充分發揮出深度學習的視覺表示能力,必須建立在充足的高質量訓練資料、優秀的模型結構和模型訓練方法,以及強大的的計算資源等基礎能力之上。


騰訊 AI Lab團隊將基於 Tencent ML-Images 的 ResNet-101 模型遷移到很多其他視覺任務,包括影象物體檢測,影象語義分割,視訊物體分割,視訊物體跟蹤等。


640?wx_fmt=png

應用於“天天快報”新聞封面影象的質量得到明顯提高


這些視覺遷移任務進一步驗證了該模型的強大視覺表示能力和優異的泛化效能。“Tencent ML-Images”專案未來還將在更多視覺相關的產品中發揮重要作用。


開源地址:

https://github.com/Tencent/tencent-ml-images



【完】


2018 AI開發者大會

只講技術,拒絕空談


2018 AI開發者大會是一場由中美人工智慧技術高手聯袂打造的AI技術與產業的年度盛會!是一場以技術落地為導向的乾貨會議!大會設定了10場技術專題論壇,力邀15+矽谷實力講師團和80+AI領軍企業技術核心人物,多位一線經驗大咖帶你將AI從雲端落地。


即刻點選「閱讀原文」或者識別海報二維碼報名參會,立享7折優惠票價(更有定量學生票)!


大會日程以及嘉賓議題請檢視下方海報

(點選檢視大圖)

640?wx_fmt=jpeg

640?wx_fmt=jpeg


點選「閱讀原文」,檢視大會更多詳情。2018 AI開發者大會——擺脫焦慮,擁抱技術前沿。