2018年自然語言處理最值得關注的研究、論文和程式碼

阿新 • • 發佈：2019-01-08

2018年對於自然語言處理（NPL）是很有意義的一年，見證了許多新的研究方向和尖端成果。Elvis Saravia 是計算語言學專家，也是2019 計算語言學會年度大會北美分部的專案委員之一。他總結了2018年 NLP 的重要進展，包括增強學習、情感分析和深度學習等領域。
點選文章中的連結，可獲得每一項研究的詳細資訊、論文或者程式碼。

綜合領域

Facebook 研究員們發明了一種機器翻譯的新方法，只需要使用單一語言語料庫，這對於缺乏資料的語言非常有用。
Young 和同事更新了他們近期發表的論文《基於深度學習的自然語言處理的最新趨勢》，增加了 NLP 文獻中最新的 SQuAD 結果。

Bloomberg 研究員 Yi Yang 發表了 RNN 卷積篩選建模的最新論文及程式碼，稱體現了語言中的長期依存性和組合性。
百度釋出了 Deep Voice 3，是一項基於注意、完全卷積的文字語音轉換神經系統，比目前的迴圈系統在神經語音合成方面快幾個量級。
Pair2vec 是一種學習文字嵌入對的新方法，能體現隱含關係的背景知識。
百度釋出了名為同聲翻譯與預測及可控延遲（STACL）的機器翻譯演算法，能夠同時進行多個翻譯。在同聲傳譯時，這項技術不需要等發言者暫停發言，而可以預測發言者的下一個詞語。
Deep INFOMAX 是一種學習無監督表徵的方法，將輸入和高層特徵向量之間的共同資訊最大化。
蒙特利爾大學的 AI 研究團隊 MILA 發表了多個超讚的研究成果，記錄了自然語言生成（NLG）任務中 GAN 的限制。
聊天機器人是 NLP 的一個重要研究領域，創業公司 lang.ai 如何使用無監督 AI 來解決打造聊天機器人的重要挑戰之一：理解使用者到底想要什麼。
這個模型提供了一種新方法進行文字生成，可以實現更強的解讀性和控制性。
谷歌 AI 發表了論文，探索語言建模的極限。
亞馬遜研究員提出了一種語言建模方法，這種新的訓練策略的重要性在於，在現實中，要獲得大量的訓練資料來建立一種新能力經常是不現實的。

**增強學習
**
許多研究員認為增強學習是機器學習的最前端。我們來看看這個領域內，2018年都有哪些重大進展。

David Ha 的“世界模型”，目標是研究個體能否在其自身的夢境中學習，需要利用增強學習來學習一項規則，依靠世界模型中抽取的特徵來解決制定的任務。
OpenAI 開發了一個類似人類的機器人手，通過增強學習演算法獲得操縱物體的靈活性。
DeepMind 在《自然》雜誌釋出了一篇論文，討論虛擬環境中，人工個體的網格表徵怎樣通過向量導航找到解決。
TextWorld 是以文字遊戲為靈感的學習環境，用於訓練增強學習代理。
Google研究員開發了一項名為 MnasNet 的技術，是一種自動化神經網路架構搜尋方法，用於通過增強學習設計移動化機器學習模型。
OpenAI Five 利用增強學習，能在複雜遊戲 Dota 2 中打敗業餘水準的人類選手。
DeepMind 開發了名為 PopArt 的技術，利用增強學習在多工環境中具有高精確度。
三星的 CozNet 是一種增強學習演算法，在兩項知名的NPL比賽中展現了頂尖表現。
Arel 使用對抗獎勵學習來講故事，解決故事評估維度的侷限。
Metacar 是為無人駕駛汽車而設計的增強學習環境，在以 Tensorflow.js 打造的瀏覽器上使用。
OpenAI 釋出的 Gym Retro 平臺提供 1000多個遊戲，進行增強學習研究。

情感分析
機器學習系統需要更深的理解能力，才能與人類在情感層面互動。

這篇新論文提出了“層級化CVAE用於精準的仇恨言論分類”，能夠理解40多個群體和13中不同類別的仇恨言論。
這篇論文討論如何使用簡單的支援向量機變數獲得最佳結果，並指出模型方面需要注意的幾點。目前大部分情感分析都是基於神經方法，研究時需要注意模型和特徵的選擇。
這篇論文定量分析了推特表情膚色修改器的使用效果。

Screen_Shot_2019_01_07_at_15_51_50

這篇論文討論如何使用深度卷積神經網路檢測諷刺。另外，這項新研究使用眼動追蹤、NLP和深度學習演算法檢測諷刺。
研究員開發了一項成為“情感聊天機器”的方法，這個聊天機器人不僅能給出符合事實與邏輯的答案，還能在聊天中加入悲傷、厭煩等情緒。
Lei Zhang 等研究員發表了一篇論文，綜合概括了深度學習方法如何用於情感分析。
這個雙向非同步框架可以在聊天中生成有意義的情感回覆。
這項研究使用計算機視覺方法，研究語境中的情感識別。
這篇在2018 NAACL 大會上發表的論文，提出了一種方法可以使用簡單的遞迴神經網路模擬情感流。

深度學習

DeepMind 與哈佛大學教師 Wouter Kool 合作發表了論文，研究人類如何使用大腦來做決定，以及這些研究結果能如何啟發人工智慧的研究。
這篇論文引入了“群組歸一化”的概念，可以有效替代批歸一化，被認為是深度學習的一項重要技術。
Sperichal CNN 是一種打造卷積神經網路的新方法。
BAIR 釋出了一篇文章，討論目前迴圈神經網路和前饋神經網路在解決各種問題時的優缺點。
Facebook 的 AI 研究小組開發了一項新技術，能將 AI 模型執行效率提升16%。這能提高 AI 模型的訓練速度，並簡化模型的量化和執行。
這篇《自然》雜誌論文，介紹了一種可以預測地震後餘震位置的深度學習方法。
DeepMind 研究員開發了一種新方法，利用神經算數邏輯單元（NALU）改善神經網路，追蹤時間、用數字圖片執行算數、數圖片中的物體個數等等。
DARTS 是一種架構搜尋演算法，可以設計高效能的影象分類卷積架構。
這篇論文《實證驗證序列建模中的通用卷積網路和神經網路》，討論了序列建模中 CNN 和 RNN 的區別。
圖形神經網路如何幫助推斷潛在關係結構、模擬多代理和物理動態。
谷歌 AI 研究團隊釋出了一篇論文，提出了一種改進版的 RNN，能夠提高自動資料解讀的精確度。
Distill 釋出了新研究，可以在一個數據源的語境下分析另一個數據。
-
如果沒有任何資料、也沒有任何人類知識工程，有可能習得精準的認知模型嗎？這項研究會告訴你答案。
這篇論文詳細描述了針對深度神經網路的批歸一化研究。
這篇論文回顧了神經網路中，如何更好地進行批訓練。
這篇論文討論如何正確評估深度半監督學習演算法。

本文由阿里云云棲社群組織翻譯。
文章原標題《NLP Highlights of 2018》，譯者：炫，審校：袁虎。
文章簡譯，更為詳細的內容，請檢視原文。

2018年自然語言處理最值得關注的研究、論文和程式碼

2018年對於自然語言處理（NPL）是很有意義的一年，見證了許多新的研究方向和尖端成果。Elvis Saravia 是計算語言學專家，也是2019 計算語言學會年度大會北美分部的專案委員之一。他總結了2018年 NLP 的重要進展，包括增強學習、情感分析和深度學習等領域。點選文章中的連結，可獲得每一項研究的詳

2018年，自然語言處理最全的應用、融資與合作

2018年見證了 NLP 許多新的應用發展。Elvis Saravia 是計算語言學專家，也是2019 計算語言學會年度大會北美分部的專案委員之一。他在一份報告中總結出，NLP 不僅在聊天機器人和機器學習中有所突破，也在醫療健康、金融、法律和廣告等行業中有嶄新的表現。點選文章中的連結，可檢視詳細資訊。聊天

2018彙總自然語言處理篇

隱馬爾可夫分詞雙陣列Trie樹高效構建有向無環圖 AC自動機+trie樹實現高效多模式匹配字典同義詞相似度可以怎樣計算怎樣衡量兩個字串的相似度（編輯距離動態規劃求解）怎樣實現基於Trie樹和字典的分詞功能一圖簡看基於搜尋的問答機器人設計雙向迴圈神經網路+條

python自然語言處理——1.4 回到python：決策和控制

ott thead top linear 控制 san max-width eight 技術分享微信公眾號：數據運營人本系列為博主的讀書學習筆記，如需轉載請註明出處。第一章語言處理與python 1.4 回到python：決策和控制條件對每個元素進行操作嵌套

自然語言處理技術之準確率(Precision)、召回率(Recall)、F值(F-Measure)簡介

下面簡單列舉幾種常用的推薦系統評測指標： 1、準確率與召回率（Precision & Recall）準確率和召回率是廣泛用於資訊檢索和統計學分類領域的兩個度量值，用來評價結果的質量。其中精度是檢索出相關文件數與檢索出的文件總數的比率，衡量的是檢索系統的查準

自然語言處理的一些演算法研究和實現(NLTK)

自然語言處理中演算法設計有兩大部分：分而治之和轉化思想。一個是將大問題簡化為小問題，另一個是將問題抽象化，向向已知轉化。前者的例子：歸併排序；後者的例子：判斷相鄰元素是否相同（與排序）。這次總結的自然語言中常用的一些基本演算法，算是入個門

2018年值H5二八杠棋牌架設、框架和工具

允許 api 機器人 react 8.0 組件 dev 標準增加 Web平臺最近H5二八杠棋牌架設( h5.super-mans.com Q:2012035031)H5二八杠棋牌架設，他們打開快速和高效的Web應用程序的門，彌合與本地編譯應用程序的差距。Servic

2018年最值得關注學習的25個JavaScript開源專案

為大家推薦GitHub上25個今年最值得關注學習的JavaScript開源專案，這些專案的平均star數達到5000個。 No.1 Prettier：一款幫你解決程式碼風格問題的程式碼格式化工具，功能強大，簡單易用，支援多語言，減少配置項。[GitHub上26755個st

論文 | 自然語言處理頂會ACL 2018該關注什麼？螞蟻金服專家告訴你！

from:https://www.sohu.com/a/244543352_99940985 一年一度的ACL大會今年7月15日至20日在澳大利亞墨爾本召開。作為自然語言處理的頂級會議，雖然遠在澳洲召開，也吸引了1500位從全球各地趕來的專業人員參會。螞蟻金服派出了數位技術專家代表公司前去參會，

2018年最值得關注的30個Vue開源專案

譯者按：學習優秀的開源專案是提高程式碼水平最有效的方式。為了保證可讀性，本文采用意譯而非直譯。另外，本文版權歸原作者所有，翻譯僅用於學習。小編推薦：Fundebug專注於JavaScript、微信小程式、微信小遊戲，Node.js和Java線上bug實時監控。真的是一個很好用的bug監控服務，眾多大佬公司都

預測：2019年最值得關注的程式語言是什麼？

我知道，我知道 - 2018年還沒有結束！但我覺得現在是退一步看看2018年我們看到的一些最熱門技術的好時機，談談他們的狀況以及對他們前景提出的問題。對於我們最喜歡的許多技術來說，2018年是一個繁忙而富有成效的一年。然而，有些人在聚光燈下享受了更多的關注。在本文中

自然語言處理怎麽最快入門？

改進一個問答系統好的必須開源都在程序得出自然語言處理（簡稱NLP），是研究計算機處理人類語言的一門技術，包括： 1.句法語義分析：對於給定的句子，進行分詞、詞性標記、命名實體識別和鏈接、句法分析、語義角色識別和多義詞消歧。 2.信息抽取：從給定文本中抽

自然語言處理---用隱馬爾科夫模型（HMM）實現詞性標註---1998年1月份人民日報語料---learn---test---evaluation---Demo---java實現

fileinput 流程 n) 一次 tostring model pen mem rbd 先放上一張Demo的測試圖測試的句子及每個分詞的詞性標註為：目前/t 這/rzv 條/q 高速公路/n 之間/f 的/ude1 路段/n 已/d 緊急/a 封閉/v 。/

斯坦福大學-自然語言處理入門筆記第十一課最大熵模型與判別模型（2）

一、最大熵模型 1、模型介紹基本思想：我們希望資料是均勻分佈的，除非我們有其他的限制條件讓給我們相信資料不是均勻分佈的。均勻分佈代表高熵（high entropy）。所以，最大熵模型的基本思想就是我們要找的分佈是滿足我們限制條件下，同時熵最高的分佈。熵：表示分佈的不

斯坦福大學-自然語言處理入門筆記第八課最大熵模型與判別模型

一、生成模型與判別模型 1、引言到目前為止，我們使用的是生成模型（generative model)，但是在實際使用中我們也在大量使用判別模型（discriminative model)，主要是因為它有如下的優點：準確性很高更容易包含很多和

【自然語言處理】最全的window下NLTK安裝說明

文章目錄 NLTK安裝說明前言說明一、獲取自然語言工具包二、安裝自然語言工具包三、獲取，安裝NLTK資料包 1、方式一 2、方式二

2018全球最值得關注的60家半導體公司，7家中國公司新上榜 | 年度榜單

編譯 | 張璽四月來源：機器之能由《EE Times》每年評選全球值得關注的 60 家新創半導體公司排行榜——『Silicon 60』，今年已經邁向第 19 屆，今年的關鍵詞仍然是「機器學習」(machine learning)，它正以硬體支援

15年來，自然語言處理神經網路相關技術發展史上的8大里程碑

原標題：15年來，自然語言處理髮展史上的8大里程碑自然語言是人類獨有的智慧結晶。自然語言處理（Natural Language Processing，NLP）是電腦科學領域與人工智慧領域中的一個重要方向，旨在研究能實現人與

2019年最值得關注的5種變革技術！將改寫人類生活歷史！

我們生活在一個大規模技術變革的時代，但有時候這一切都變得如此複雜，以至於很難找出真正改變世界的東西，以及將會墮落的東西。 Lux的研究人員研究了將改變世界經濟的關鍵技術創新 - 以及我們未來10年的生活。其1919年的201年報告著眼於市場障礙面臨的創新以及那

2019年最值得關注的5個人工智慧趨勢！

在2018年期間，我們目睹了基於機器學習和人工智慧的平臺，工具和應用程式的急劇增長。這些技術不僅影響了軟體和網際網路行業，還影響了其他垂直行業，如醫療保健，法律，製造業，汽車和農業。我們將繼續看到2019年及以後的ML和AI相關技術的進步。亞馬遜，蘋果，Facebo

2018年自然語言處理最值得關注的研究、論文和程式碼

相關推薦