騰訊AI Lab開源業內最大規模多標籤影象資料集（附下載地址）

阿新 • • 發佈：2018-10-31

參加 2018 AI開發者大會，請點選 ↑↑↑

今日（10 月 18 日），騰訊AI Lab宣佈正式開源“Tencent ML-Images”專案。該專案由多標籤影象資料集 ML-Images，以及業內目前同類深度學習模型中精度最高的深度殘差網路 ResNet-101 構成。

該開源專案的主要內容包括：

1、ML-Images 資料集的全部影象 URLs,以及相應的類別標註。出於原始影象版權的考慮，此次開源將不直接提供原始影象，使用者可利用我們提供的下載程式碼和 URLs 自行下載影象。

2、ML-Images 資料集的詳細介紹，包括影象來源，影象數量，類別數量，類別的語義標籤體系，標註方法，以及影象的標註數量等統計量。

3、完整的程式碼和模型。我們提供的程式碼涵蓋從影象下載，影象預處理，基於 ML-Images 的預訓練，基於 ImageNet 的遷移學習，到基於訓練所得模型的影象特徵提取的完整流程。該專案提供了基於小資料集的訓練示例，以方便使用者快速體驗我們的訓練流程。該專案還提供了非常高精度的 ResNet-101 模型（在單標籤基準資料集 ImageNet 的驗證集上的 top-1 精度為 80.73%）。使用者可根據自身需求，隨意選用該專案的程式碼或模型。

以深度神經網路為典型代表的深度學習技術已經在很多領域充分展現出其優異的能力，尤其是計算機視覺領域，包括影象和視訊的分類、理解和生成等重要任務。然而，要充分發揮出深度學習的視覺表示能力，必須建立在充足的高質量訓練資料、優秀的模型結構和模型訓練方法，以及強大的的計算資源等基礎能力之上。

騰訊 AI Lab團隊將基於 Tencent ML-Images 的 ResNet-101 模型遷移到很多其他視覺任務，包括影象物體檢測，影象語義分割，視訊物體分割，視訊物體跟蹤等。

640?wx_fmt=png

應用於“天天快報”新聞封面影象的質量得到明顯提高

這些視覺遷移任務進一步驗證了該模型的強大視覺表示能力和優異的泛化效能。“Tencent ML-Images”專案未來還將在更多視覺相關的產品中發揮重要作用。

開源地址：

https://github.com/Tencent/tencent-ml-images

【完】

2018 AI開發者大會

◆

只講技術，拒絕空談

◆

2018 AI開發者大會是一場由中美人工智慧技術高手聯袂打造的AI技術與產業的年度盛會！是一場以技術落地為導向的乾貨會議！大會設定了10場技術專題論壇，力邀15+矽谷實力講師團和80+AI領軍企業技術核心人物，多位一線經驗大咖帶你將AI從雲端落地。

即刻點選「閱讀原文」或者識別海報二維碼報名參會，立享7折優惠票價（更有定量學生票）!

大會日程以及嘉賓議題請檢視下方海報

（點選檢視大圖）

640?wx_fmt=jpeg

點選「閱讀原文」，檢視大會更多詳情。2018 AI開發者大會——擺脫焦慮，擁抱技術前沿。

騰訊AI Lab開源業內最大規模多標籤影象資料集（附下載地址）

騰訊AI Lab開源業內最大規模多標籤影象資料集（附下載地址）

微軟、谷歌、亞馬遜、Facebook等矽谷大廠91個開源軟體盤點（附下載地址）

2017-10-12 釋出 BAT等大廠已開源的70個實用工具盤點（附下載地址）

BAT等大廠已開源的70個實用工具盤點（附下載地址）

騰訊 AI Lab 正式開源PocketFlow，讓深度學習放入手機！

騰訊AI Lab正式開源PocketFlow自動化深度學習模型壓縮與加速框架

AI+醫療：基於模型的醫療應用大規模分析 | 騰訊AI Lab學術論壇演講

騰訊 AI Lab 計算機視覺中心人臉 & OCR團隊近期成果介紹（3）

騰訊技術工程 |騰訊AI Lab刷新人臉識別與檢測兩大測評國際記錄，技術日調用超六億

騰訊技術工程 | 騰訊AI Lab 現場陳述論文：使眾包配對排名聚合信息最大化的 HodgeRan

騰訊AI Lab AAAI18現場陳述論文：用隨機象限性消極下降算法訓練L1範數約束模型

騰訊技術工程 | 騰訊 AI Lab 11篇論文精選：圖像描述、NMT 模型、圖卷積神經網絡等

騰訊副總裁姚星：騰訊AI Lab將致力打造通往AGI之路

CVPR 2018 | 騰訊AI Lab入選21篇論文詳解

從研究到應用：騰訊AI Lab的自然語言理解和生成

中科大教授吳鋒：多智能體的分布式在線決策 | 騰訊AI Lab學術論壇演講

AI+遊戲：高效利用樣本的強化學習 | 騰訊AI Lab學術論壇演講

NIPS2018 | 騰訊AI Lab入選20篇論文，含2篇Spotlight

基於騰訊AI Lab詞向量進行未知詞、短語向量補齊與域內相似詞搜尋

CVPR2018-騰訊AI Lab提出新型損失函式LMCL：可顯著增強人臉識別模型的判別能力

騰訊AI Lab開源業內最大規模多標籤影象資料集（附下載地址）

相關推薦