Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

阿新 • • 發佈：2018-11-22

一、概要

通過知識庫回答自然語言問題是一個重要的具有挑戰性的任務。大多數目前的系統依賴於手工特徵和規則。本篇論文，我們介紹了MCCNNs，從三個不同層面（答案路徑，答案型別，答案上下文）來理解問題。同時，在知識庫中我們共同學習實體和關係的低維詞向量。問答對用於訓練模型以對候選答案進行排名。我們還利用問題釋義以多工學習方式訓練列網路。我們使用Freebase作為知識庫，在WebQuestions資料集上進行實驗。此外，我們提出了一種計算不同列網路中問題詞的顯著性得分的方法。結果有助於我們直觀地瞭解MCCNN學到的知識。

二、介紹

自動問答系統返回自然語言問題的直接和正確的答案。目前為止，對於這個任務有兩個主流的方法。第一個方法依賴於語義解析，第二個方法依賴於資訊抽取。
語義解析器通過將他們轉換為邏輯形式來理解自然語言問題。然後，解析結果用於生成結構化查詢來查詢知識庫獲得答案。最近的研究工作著重於使用問答對，而不是問題的標註邏輯形式，因為弱訓練訊號降低標註成本。但是，他們中的一些人仍假設一組固定的和預定義的詞彙觸發器，這些觸發器限制了它們的領域和可擴充套件效能力。此外，他們需要手動設計語義解析器的特徵。
第二個方法使用資訊抽取來進行開放域問答。這類方法從知識庫中檢索候選答案的集合，提取問題和候選答案的特徵來對候選答案排名。然而，這類方法依賴於規則和依存分析結果來提取問題的手工特徵。
另外，一些方法使用問題詞向量的總和來表示問題，這忽略了詞序資訊並且不同處理複雜的問題。
本篇論文，我們介紹了MCCNNs從不同方面自動分析問題。該模型共享相同的詞向量來表示問題單詞。MCCNNs從輸入問題中使用不同列的網路來提取答案型別，關係和上下文資訊。知識庫中的實體和關係也都表示為低維向量。然後，評分層根據問題和候選答案的表示對候選答案排名。所提出的基於資訊抽取的方法利用問答對自動學習模型，而不依賴於手工註釋的形式和手工特徵。我們也沒用使用任何的詞法觸發器和規則。此外，問題釋義還用於訓練網路並以多工學習方式概況生詞。早WebQuestions資料集進行實驗，結果優於baseline：
本篇文章有三個貢獻：

我們介紹了多列的卷積神經網路來理解問題，不依賴於手工特徵和規則，並且利用問題釋義以多工學習的方式來訓練列網路和詞向量。
我們共同學習FREEBASE中實體和關係的低維詞向量，並將問答對作為監督訊號;
我們在WEBQUESTIONS資料集上進行了大量實驗，並通過開發一種檢測不同列網路中顯著問題單詞的方法，為MCCNN提供了一些直觀的解釋。

三、相關工作

主要介紹了主流的兩個傳統方法，上面已經介紹過了，這裡不再介紹。

四、建立過程

給定一個自然語言問題q = $w$

1 w_1

w_{1}

…

w_n

，我們從FreeBase中檢索相關的實體和屬性，作為候選答案

C_q

。我們的目標是對這些候選答案進行評分並且預測答案。一個問題可能有幾個正確答案。為了訓練模型，我們使用沒有標註邏輯形式的問答對。首先我們先描述一下資料集：
WebQuestions：資料集包括3778訓練例項和2032測試例項。將訓練例項分為80%訓練集和20%驗證集。
Freebase：由一般事實組成的大規模知識庫，事實格式為 subject-property-object的三元組。保留其中一個實體出現在WebQuestions的訓練集 / 驗證集或者CLUEWEB的三元組，移除實體次數少於5次的三元組。
WikiAnswers：Fader et al.（2013）在WikiAnswers中提取了相似問題並將他們作為問題釋義，用於概括生詞和問題模式。

五、方法

在這裡插入圖片描述
我們使用多列卷積神經網路來學習問題的表示，模型共享相同的詞向量，這些列描述問題的不同層面。比如答案路徑、答案型別、答案上下文。向量表示為 $f_1(q),f_2(q),f_3(q)$ 。相應地，我們也學習候選答案的表示，對每一個候選答案a，表示為 $g_1(a),g_2(a),g_3(a)$ 。使用問題和答案的表示，我們可以計算問答對的分數。評分函式S(q,a)定義為：
$S(q,a) = \underbrace{f_1(q)^Tg_1(a)}_{answer\ path} + \underbrace{f_2(q)^Tg_2(a)}_{answer\ context} + \underbrace{f_3(q)^Tg_3(a)}_{answer \ type}$

1. 候選答案的生成
給定一個問題，首要步驟就是從Freebase知識庫中檢索候選答案。問題應該包含一個確定的實體，該實體可以連結到知識庫中。我們使用Freebase Search API查詢問題中的命名實體。如果沒有任何命名實體，那麼名詞短語代替。我使用排在第一位置的實體。然後連結到該實體的全部2跳之內的節點作為候選答案。對給定問題q，我們用Cq表示候選答案集。

2. 問題理解
MCCNNs使用多列的卷積神經網路從共享詞向量中學習問題的不同層面的特徵。對於問題q = $w_1...w_n$ ，lookup layer將每一個單詞轉換為一個向量 $w_j = W_vu(w_j)$ ，其中 $W_v \in R^{d_v \times |V|}$ 是詞向量矩陣， $u(w_j) \in \{0,1\}^{|V|}$ 是 $w_j$ 的one-hot表示，|V|是詞彙大小。詞向量在訓練過程中更新。
卷積層計算滑動視窗中單詞的表示。對第 i 列的MCCNNs，卷積層對問題q計算n個向量，第j個向量表示如下：
$x_j^{(i)} = h(W^{(i)}[w_{j-s}^T...w_{j}^T...w_{j+s}^T]^T + b^{(i)})$
其中（2s + 1）是視窗大小， $W^{(i)} \in R^{d_q \times (2s + 1)d_v}$ 是卷積層的權重矩陣， $b^{(i)} \in R^{d_q \times 1}$ 是bias向量，h(·)是非線性函式（softsign，tanh，sigmoid）。填充左右不存在的單詞。
最終，經過最大池化層獲得問題的固定大小向量表示。在第i列MCCNNs的最大池化層計算問題q的表示通過：
$f_i(q) = \max_{j=1,...,n}\{x_j^{(i)}\}$

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

一、概要通過知識庫回答自然語言問題是一個重要的具有挑戰性的任務。大多數目前的系統依賴於手工特徵和規則。本篇論文，我們介紹了MCCNNs，從三個不同層面（答案路徑，答案型別，答案上下文）來理解問題。同時，在知識庫中我們共同學習實體和關係的低維詞向量。問答對用於訓練模型以對候選答案

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記】

Information Extraction over Structured Data:Question Answering with Freebase 一、摘要

Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base【論文筆記】

一、摘要我們對知識庫問答提出一個新穎的語義解析框架。我們定義了一個類似於知識庫子圖的查詢圖，可以直接對映為邏輯形式。語義解析被簡化為查詢圖生成，被表述為分階段搜尋問題。與傳統方法不同，我們的方法在早期就利用知識庫來修剪搜尋空間，從而簡化語義匹配問題。通過應用實體鏈指系統和深度卷

Question Answering with Subgraph Embeddings【論文筆記】

一、摘要這篇論文提出一個系統，在大範圍主題的知識庫中，學習使用較少的手工特徵來回答問題。我們的模型學習單詞和知識庫組成的低維詞向量。這些表示用於根據候選答案對自然語言問題打分。使用成對的問題和對應答案的結構化表示，和成對的問題釋義來訓練系統，在最近的文獻基準中產生有競爭力的結果。 &n

人群計數：Single-Image Crowd Counting via Multi-Column Convolutional Neural Network(CVPR2016)

本博文主要是CVPR2016的《Single-Image Crowd Counting via Multi-Column Convolutional Neural Network》這篇文章的閱讀筆記，以及對人群計數領域做一個簡要介紹。 Abstract

DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks

step with 圖片 eight enter sub img layer each 1、Introduction DL解決VO問題：End-to-End VO with RCNN 2、Network structure a.CNN based Feature Ext

Semantic Parsing on Freebase from Question-Answer Pairs【論文筆記】

參考：https://zhuanlan.zhihu.com/p/25759682 原文：https://cs.stanford.edu/~pliang/papers/freebase-emnlp2013.pdf 一、摘要作者訓練了一個可擴充套件到Freebase的語義解析器，由於

【論文筆記】Neural Relation Extraction with Multi-lingual Attention

一、概要該paper發於ACL2017上，作者主要基於關係事實通常在各種語言中存在某種模式表達，並且不同語言之間的模式是不同的這兩個動機，針對於當前存在的單語言關係抽取的方法，從

【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

一、概要該文章發於ACL 2017，在Knowledge base-based question answering (KB-QA)上，作者針對於前人工作中存在沒有充分考慮候選答案的相關資訊來訓練question representation的問題，提出

A Beginner's Guide To Understanding Convolutional Neural Networks Part One 筆記

不同 there level cto all guid line feature 函數原文鏈接：https://adeshpande3.github.io/adeshpande3.github.io/A-Beginner‘s-Guide-To-Understanding-

【論文筆記】用形狀做擋風玻璃上的雨滴檢測《Detection Of Raindrop With Various Shapes On A Windshield》

《Detection of Raindrop with Various Shapes on a Windshield》 1 介紹 2 雨滴檢測方法在白天和夜晚使用不同的演算法。通過整幅影象的強度水平判斷是白天還是夜晚。 2.1 白天的雨滴檢測方法這個方法假設

【論文筆記】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

寫在前面：我看的paper大多為Computer Vision、Deep Learning相關的paper，現在基本也處於入門階段，一些理解可能不太正確。說到底，小女子才疏學淺，如果有錯

【醫學影像】《Dermatologist-level classification of skin cancer with deep neural networks》論文筆記

這是一篇關於面板癌分類的文章，核心就是分類器，由斯坦福大學團隊發表，居然發到了nature上，讓我驚訝又佩服，雖然在方法上沒什麼大的創新，但是論文字身的工作卻意義重大，並且這篇17年見刊的文章，引用量已經達到1300多，讓人佩服，值得學習。【出發點】現有的面板癌分類系統由於資料量不夠，同時只針對標準化的影

【論文筆記】FOTS: Fast Oriented Text Spotting with a Unified Network

pdf連結：https://arxiv.org/pdf/1801.01671.pdf資料集的相關情況：1.ICDAR2013ICDAR2013包括四個資料夾，分別是：訓練影象集：Challenge2_Training_Task12_Images訓練標註集：Challenge2

【論文筆記】One Millisecond Face Alignment with an Ensemble of Regression Trees

參考文獻： Kazemi V, Sullivan J. One millisecond face alignment with an ensemble of regression trees[C]//Computer Vision and Pattern

【論文筆記】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

《Region-based Convolutional Networks for Accurate Object Detection and Segmentation》是將卷積神經網路應用於物體檢測的一篇經典文章。整個識別過程可以用下面的一張圖片來清晰的表示：首先給定一

【論文筆記】An Intelligent Fault Diagnosis Method Using: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks

ivar 單位矩陣作用一次一個 http example tps 計算論文來源：IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS 2016年的文章，SCI1區，提出了兩階段的算法。第一個階段使用Sparse filtering

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

一、概要

二、介紹

三、相關工作

四、建立過程

五、方法

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記】

Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base【論文筆記】

Question Answering with Subgraph Embeddings【論文筆記】

人群計數：Single-Image Crowd Counting via Multi-Column Convolutional Neural Network(CVPR2016)

DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks

Semantic Parsing on Freebase from Question-Answer Pairs【論文筆記】

【論文筆記】Neural Relation Extraction with Multi-lingual Attention

【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

A Beginner's Guide To Understanding Convolutional Neural Networks Part One 筆記

【論文筆記】用形狀做擋風玻璃上的雨滴檢測《Detection Of Raindrop With Various Shapes On A Windshield》

【論文筆記】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

【醫學影像】《Dermatologist-level classification of skin cancer with deep neural networks》論文筆記

【論文筆記】FOTS: Fast Oriented Text Spotting with a Unified Network

【論文筆記】One Millisecond Face Alignment with an Ensemble of Regression Trees

【論文筆記】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

【論文筆記】An Intelligent Fault Diagnosis Method Using: Multivariate Anomaly Detection for Time Series Data with Generative Adversarial Networks

Multi-Perspective Sentence Similarity Modeling with Convolutional Neural Networks的理解以及翻譯

[CVPR2015] Is object localization for free? – Weakly-supervised learning with convolutional neural networks論文筆記

閱讀筆記：ImageNet Classification with Deep Convolutional Neural Networks

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

一、概要

二、介紹

三、相關工作

四、建立過程

五、方法

相關推薦