1. 程式人生 > >Bayes Belief Networks詳解(附帶詳細公式推導)

Bayes Belief Networks詳解(附帶詳細公式推導)

Bayes Belief Networks詳解

第十次寫部落格,本人數學基礎不是太好,如果有幸能得到讀者指正,感激不盡,希望能借此機會向大家學習。這篇文章主要分為一下三部分來介紹貝葉斯信念網(BayesBeliefNetworks):BNN的簡要介紹、如何構建BNN、如何基於BNN進行估計以及BNN的特點。

貝葉斯信念網

這一部分主要是講貝葉斯網的基本結構、條件獨立性與邊界獨立性以及條件獨立性分析。

基本結構

  “貝葉斯信念網路”(BayesBeliefNetworks,BBN),簡稱貝葉斯網,用圖形表示一組隨機變數(屬性)之間的依賴關係。有兩個重要的組成部分:
  (1)一個有向無環圖(DirectedAcyclicGraph,簡稱DAG),來刻畫變數之間的依賴關係。
  (2)一個概率表(ConditionalProbabilityTable,簡稱CDT),來描述隨機變數之間(子結點與父結點之間)的聯合概率分佈。
  具體來說,一個貝葉斯網

B由有向無環結構G和概率引數表θ組成,即B=<G,θ>。有向無環結構G中的每個結點代表了一個隨機變數,如果兩個變數之間有直接的依賴關係,那麼就將他們通過一條有向邊連線起來。概率引數表θ則是定量的描述這種依賴關係,例如,假設屬性xG中只有一個父結點y,那麼θx|y描述了這倆變數所組成的條件概率分佈,即θx|y=PB(x|y);假設屬性xG中有多個父結點yi(i=1,2,...,n),那麼θx|y描述了這n+1個變數所組成的條件概率分佈,即θx|y=PB(x|y1,y2,...,yn);假設屬性x沒有父結點,那麼θx|y描描述了這個變數的先驗概率分佈,即θx|y=PB(x)。基於上述幾種情況,貝葉斯網中各個屬性的聯合概率分佈可以表示為

  下面舉一個簡單的例子,下圖給出了西瓜問題的一種貝葉斯網路表示。可以從圖中看出,“敲聲”依賴於“好瓜”,“色澤”依賴於“好瓜”和“甜度”,而“根蒂”依賴於“甜度”,從“甜度->根蒂”的概率引數表中,可以得知這兩個屬性之間的定量的依賴資訊,如P(=|=)=0.1

條件獨立性與邊際獨立性

  貝葉斯網路中有如下圖所示的三種典型依賴關係:同父結構、V型結構、順序結構。

  這三種結構存在以下幾種不同的依賴關係:
  (1) 在同父結構中,如果給定父結點x1的取值,那麼子結點x3x4條件獨立。
  (2) 在順序結構中,如果給定結點x的取值,那麼結點yz條件獨立。
  (3) 在V型結構中,如果給定子結點x4的取值,那麼父結點x1x2必不獨立;反之,子結點x4的取值未知,那麼結點x1x2滿足邊際獨立性。
  前兩種結構可以統稱為“滿足條件獨立性”,即貝葉斯網路中的某個結點,如果他的所有父結點已知,那麼它條件獨立於它的所有非後代結點。如下圖中,如果給定結點C的取值,那麼結點A條件獨立於結點BD

條件獨立性分析

  為了分析有向圖G中變數間的條件獨立性,可以使用“有向分離”(DirectedSeparation),將一個有向圖轉換為無向圖。具體步驟如下:
  (1)找出有向圖中的所有V型結構,在V型結構的兩個父結點之間加上一條無向邊;
  (2)將所有的有向邊改為無向邊。
由此產生的無向圖稱為“道德圖”(MoralGraph),令父結點相連的過程稱為“道德化”(Moralization)。通過道德圖可以快速、有效的找到變數間的條件獨立性,具體的步驟是,假設道德圖中有變數