斯坦福大學-自然語言處理入門筆記第十六課依存句法分析（Dependency Parsing）

阿新 • • 發佈：2018-11-06

一、介紹

1、依存句法

依存句法假設：句法結構包含相互之間是雙邊不對稱關係的詞典（lexical）元素，這種不對稱的關係成為依存（dependency），在圖中的表現是單向箭頭。
箭頭通常還會打上這種語法關係的名字（主語，前置賓語等等）
箭頭一邊連線中心詞head (governor, superior, regent)，一邊則連線依存詞dependent (modifier, inferior, subordinate)。
這種關係表現為樹結構

2、片語結構（phrase structure）與依存結構之間的關係

依存語法有一箇中心詞的概念。但是CFG沒有。

但是在現代的語言理論以及所有的現代統計句法分析中，確實有一個手工定義的“中心詞規則”。
- 名詞片語（NP）的中心詞是名詞/數詞/形容詞
- 動詞片語（VP）的中心詞是動詞…
“中心詞規則”可以幫助我們從上下文無關文法句法（CFG）中抽取依存句法
而從閉合的依存句法中我們亦可以得到片語結構的成分（constituency），但是同一個單詞的所有依存詞都必須在同一層中，這可能會導致片語結構和依存結構結果會略有不同。

3、四種依存分析方法

在這裡插入圖片描述

4、依存分析的資訊來源

雙單詞關聯：比如issues→the
依存距離：依存詞和中心詞的距離，大部分時候是相鄰的兩個詞

中間元素：一般依存關係之間不太可能會出現動詞或者標點
中心詞的價：一般，中心詞的左邊/右邊有多少個依存。

二、貪婪轉換句法分析（Greedy Transition-Based Parsing）

1、MaltPaser

這是一種簡單形式的判別依存句法分析。這種句法分析涉及到一系列自底向上的行動，比如移動（shift）和移除（reduce）。
這種分析句法含有：
- 一個堆疊 stack σ，從ROOT開始從頂向右儲存
- 一個緩衝區 buffer β，從輸入的句子開始從頭到左
- 一系列依存關係（dependency arcs），一開始是空的
- 一系列操作（action）
用字母語言來表示
- 初始狀態：σ=[ROOT],β=w1,…,wn, A=空集
- 基本的轉換依存句法分析（Basic transition-based dependency parser）
- “arc-eager”依存句法分析：上面基本的句法分析方法在處理某些依存結構的時候會存在一些問題，因此對操作進行了改進。
- 例子：
如何得知下一步操作是什麼？
- 利用一個判別分類模型來幫助我們判斷下一步需要做的操作是什麼。可以是SVM，也可以是最大熵模型。
  - 如果這是一個不標記依存類別的分類，那麼我們的判別模型就是一個四分類問題，如果這是一個標記依存類別的分類問題，那麼總的分類類別就是|R|*2+2，其中|R|表示依存類別的個數。
  - 判別模型的特徵一般是：棧頂的單詞以及對應的詞性；在緩衝區的第一個單詞以及詞性等等
  - 這是一個貪婪的演算法，作為改進的話，可以做一些束搜尋（beam search）
這種語法分類方法的正確率只比最好的詞彙化PCFGs低了一點點，但它是一個線性時間複雜度的演算法，計算起來很快。

2、依存分析的評價以及表現

對每個單詞標上序號，列出每個依存關係對應的序號和型別。分為兩種正確率的計算
- UAS：不考慮依存關係的型別，只考慮依存關係的對應單詞是否正確
- LAS：同時考慮依存關係的對應單詞以及依存關係型別
依存模型的效果

3、投射問題

一個基於帶中心詞的CFG樹，它的依存關係必須是投射性的(projective)。所謂的投射性指的是當我們在單詞的上方用帶箭頭的弧度畫出單詞之間的依存關係的時候，這些弧度是不會相互交叉的。交叉情況如下圖。
但是一般依存理論是允許非投射性（non-projective）的情況出現的：對於某些結構而言，如果不用非投射性來研究的話，我們是無法理解其語義的。
我們上面展示的“arc-eager”演算法只能建立投射性（non-projective）樹，如果我們想要處理非投射性問題的話，這裡有一些解決方法。
- 直接預設不存在非投射性的依存關係，這種關係在英語裡面確實很少存在。
- 使用一種允許投射性表示的依存框架
- 在進行投射性語法分析演算法之前，先做一步預處理，找出非投射性依存並處理
- 在依存分析的演算法中加入新的操作，以處理一些比較常見的非投射性依存
- 使用那些沒有對投射性有限制的句法分析機制，比如基於圖的MSTParser

三、利用依存關係來進行關係抽取

依存路徑可以幫助我們定義蛋白質之間的互動關係
斯坦福依存（Stanford dependency）是一個可以實現這功能的軟體。其假設所有的依存關係都是投射性的。
- 構建依存樹：斯坦福依存假設所有的依存關係都是投射性的。因此我們可以用處理過的中心片語結構（Penn Treebank syntax）來構建依存關係，也可以直接使用依存分析，像上一節提到的MaltParser。
- 在構建了依存樹之後，我們進行一些圖的調整來幫助模型可以更好地進行關係抽取。如下圖，左邊是原來的依存樹，右邊是調整後的依存關係圖。
從實證角度來看：利用依存分析進行關係抽取的優勢是，依存分析下關係詞的距離要比直接進行關係抽取的單詞直接距離來得近。下圖橫軸表示單詞距離，紅色的是依存距離，藍色的是線性距離。縱軸表示頻率。可以看到單詞之間的依存距離比線性距離更多的集中在短距離的區域中。

斯坦福大學-自然語言處理入門筆記第十六課依存句法分析（Dependency Parsing）

一、介紹 1、依存句法依存句法假設：句法結構包含相互之間是雙邊不對稱關係的詞典（lexical）元素，這種不對稱的關係成為依存（dependency），在圖中的表現是單向箭頭。箭頭通常還會打上這種語法關係的名字（主語，前置賓語等等）箭頭一邊連線中心詞head

斯坦福大學-自然語言處理入門筆記第十八課排序檢索介紹（ranked retrieval）

一、介紹之前我們的請求都是布林型別。對於那些明確知道自己的需求並且瞭解集合體情況的使用者而言，布林型別的請求是很有效的。但是對於大部分的其他使用者而言，布林請求的問題是：大部分使用者不熟悉布林請求；布林請求比較複雜；布林請求的結果不是太多就是太少。排序檢索應運而生。排序

斯坦福大學-自然語言處理入門筆記第十九課單詞含義與相似性

一、單詞含義與單詞關係回顧：詞目（lemma）與單詞形式（wordform）詞目：表示相同的詞根、詞性以及大致的語義單詞形式：表示在文件中出現的具體單詞形式一個詞目可能會含有很多含義（sense）。含義（sense）表示單

斯坦福大學-自然語言處理入門筆記第十七課資訊檢索（information retrieval）

一、介紹資訊檢索（information retrieval）是從海量集合體（一般是儲存在計算機中的文字）中找到滿足資訊需求（information need）的材料（一般是文件）資訊檢索的應用領域：網頁搜尋，郵件搜尋，電腦內部搜尋，法律資訊檢索等等資訊檢索的基

斯坦福大學-自然語言處理入門筆記第十五課詞彙化（Lexicalization）的PCFGs

一、介紹一個短語的中心詞（head word）可以很好地代表這個短語的結構和含義，在構建PCFG模型的時候，可以考慮將這部分資訊納入其中。如下圖所示加入單詞資訊可以幫助我們更好地選擇出合適的模型。二、Charniak模型 Charniak模型是詞彙化P

斯坦福大學-自然語言處理入門筆記第十四課 CGSs和PCFGs

一、概率上下文無關文法（(Probabilistic) Context-Free Grammars） 1、上下文無關文法（Context-Free Grammars）我們也可以稱之為片語結構語法(Phrase structure grammars) 由四個成分構成G=

斯坦福大學-自然語言處理入門筆記第十二課詞性標註（Part-of-speech tagging）

一、詞性（part-of-speech)介紹詞性：名詞（Nouns)，動詞（Verbs)，形容詞（Adjectives），副詞（Adverbs)等等就是我們想要研究的詞性我們可以把詞性分為開放類（open class）和閉合類（closed class）。

斯坦福大學-自然語言處理入門筆記第十一課最大熵模型與判別模型（2）

一、最大熵模型 1、模型介紹基本思想：我們希望資料是均勻分佈的，除非我們有其他的限制條件讓給我們相信資料不是均勻分佈的。均勻分佈代表高熵（high entropy）。所以，最大熵模型的基本思想就是我們要找的分佈是滿足我們限制條件下，同時熵最高的分佈。熵：表示分佈的不

斯坦福大學-自然語言處理入門筆記第十課關係抽取（relation extraction）

一、簡介關係抽取就是從文件中抽取關係，例子如下：為什麼進行關係抽取建立新的關係型知識庫（knowledge bases）增強目前的知識庫（knowledge bases）支援問題回答（question answering）

斯坦福大學-自然語言處理入門筆記第二十一課問答系統（2）

一、問答系統中的總結（summarization）目標：產生一個摘要文字包含那些對使用者重要和相關的資訊總結的應用領域：任何文件的摘要和大綱，郵件摘要等等根據總結的內容，我們可以把總結分為兩類：單文件總結：給出一個單一文件的摘要、大綱、標題

斯坦福大學-自然語言處理入門筆記第十三課統計語言句法分析（prasing）

課程來源：Introduction to NLP by Chris Manning & Dan jurafsky 關於專用名詞和概念：剛接觸NLP領域，所以有些專有名詞的翻譯和專有概念可能會存在一定的偏誤，隨著學習的深入，我會隨時更新改正。一、關於句法結構的兩種看法

斯坦福大學-自然語言處理入門筆記第九課資訊抽取（information extraction）

一、介紹 1、資訊抽取（information extraction）資訊抽取（IE）系統找到並理解文字中的有限的相關性從很多的文件之中收集資訊產生一個相關資訊的結構化的表徵目的：進行資

斯坦福大學-自然語言處理入門筆記第八課最大熵模型與判別模型

一、生成模型與判別模型 1、引言到目前為止，我們使用的是生成模型（generative model)，但是在實際使用中我們也在大量使用判別模型（discriminative model)，主要是因為它有如下的優點：準確性很高更容易包含很多和

斯坦福大學-自然語言處理入門筆記第七課情感分析（sentiment analysis）

一、情感分析簡述情感分析（sentiment analysis），又叫意見抽取（opinion extraction），意見挖掘（opinion mining）,情感挖掘（sentiment mining）以及主觀分析（subjectivity analysis）。情感分

斯坦福大學-自然語言處理入門筆記第六課文字分類與樸素貝葉斯

一、文字分類任務概述 1、應用領域歸類垃圾郵件識別作者識別性別/年齡識別等等 2、定義輸入：一個文件d，一系列固定的型別C={c1,c2,…,cj} 輸出：預測類別c ∈ C 3、分類方法

斯坦福大學-自然語言處理入門筆記第五課拼寫糾正與噪音通道（Noisy Channel）

一、拼寫糾正任務 1、拼寫任務發現拼寫錯誤糾正拼寫錯誤自動糾正給出糾正建議（一個詞）給出糾正建議（一些詞） 2、拼寫錯誤的型別拼寫出來的不是單詞（non-word spelling e

斯坦福大學-自然語言處理入門筆記第四課語言模型

一、介紹N-grams 1、概率語言模型對每個句子給出一個概率，用以判斷機器翻譯中哪個句子是最佳的選擇，拼寫校準中哪個句子可能出現錯誤。目標：計算句子或者是一系列單詞的概率

斯坦福大學-自然語言處理入門筆記第二十課問答系統（question answering）

1、什麼是問答系統問答系統是最早的NLP任務，根據問題的依存關係，找到適合的依存關係的回答。在現代系統中問題被分為兩類事實問題的回答一般都是一個簡單的片語或者是命名實體兩種問答系統的正規化基於資訊檢索的路徑：TREC; I

C語言筆記第十六課位運算子分析

第十六課位運算子分析 C語言中的位運算子位運算子直接對bit位進行操作，其效率最高位運算子操作 & 按位與 I 按位或

斯坦福大學-自然語言處理與深度學習（CS224n）筆記第三課詞向量（2）

一、word2vec 1、回顧：skip-grams word2vec的主要步驟是遍歷整個語料庫，利用每個視窗的中心詞來預測上下文的單詞，然後對每個這樣的視窗利用SGD來進行引數的更新。對於每一個視窗而言，我們只有2m+1個單詞（其中m表示視窗的半徑），因此我們計算出來的梯度向量是

斯坦福大學-自然語言處理入門 筆記 第十六課 依存句法分析（Dependency Parsing）

一、介紹

1、依存句法

2、片語結構（phrase structure）與依存結構之間的關係

3、四種依存分析方法

4、依存分析的資訊來源

二、貪婪轉換句法分析（Greedy Transition-Based Parsing）

1、MaltPaser

2、依存分析的評價以及表現

3、投射問題

三、利用依存關係來進行關係抽取

相關推薦

斯坦福大學-自然語言處理入門筆記第十六課依存句法分析（Dependency Parsing）