貝葉斯決策論

貝葉斯決策論（Bayesian decision theory）是概率框架下實施決策的基本方法。在所有相關概率都已知的理想情況下，貝葉斯決策論考慮如何基於這些概率和誤判斷來選擇最優的類別標記。
假設有N種可能的類別標記，即Y={c1,c2,...,cn}，λij是將一個真實標記為cj的樣本誤分類為ci所產生的損失。基於後驗概率P(ci|x)可獲得將樣本x分類為ci所產生的期望損失（expected loss），即在樣本x上的“條件風險”（conditional risk）

R(ci|x)=∑j=1NλijP(cj|x)
我們的任務是尋找一個判定準則h:X→Y以最小化總結風險
R

(h)=Ex[R(h(x)|x)]
顯然，對每個樣本x，若h能最小化條件風險R(h(x)|x)，則總體風險R(h)也將被最小化。這就產生了貝葉斯判定準則(Bayes decision rule):
為最小化總體風險，只需在每個樣本上選擇哪個能使條件風險R(c|x)最小化的類別標記，即：
h∗=argminc∈YR(c|x)
此時h∗成為貝葉斯最優分類器（Bayes optimal classifier）,與之對應的總體風險R(h∗)稱為貝葉斯風險，1−R(h∗)反映了分類器能達到的最好效能，即通過機器學習所能產生的模型精度的理論上限。

後驗概率最大化的意義

若我們的問題為分類問題，則可以有：

λij={01ifi=jotherwise
此時條件風險為
R(c|x)=1−P(c|x)
於是，最小化分類錯誤率的貝葉斯最優分類器為
h∗(x)=argmaxc∈YP(c|x)
所以我們可以看出後驗概率最大化就是期望風險最小化。這裡我們用了期望風險這個詞，其實和上面的條件風險是一個東西。

生成方法解決之道

不然看出我們要解決後延概率P(c|x)，判別模型就是對P(c|x)直接建模。如前面的決策樹、BP神經網路、支援向量機等，都可以歸入判別方法。對於生成模型，我們考慮：

極大似然估計

估計類條件概率的一種常用策略是先假定其具有某種確定的概率分佈形式，再基於訓練樣本對概率分佈的引數進行估計。事實上，概率模型的訓練過程就是引數估計（parameter estimation）過程。
對於引數估計，統計學界有兩種方案：

頻率主義學派（Frequentist）認為引數雖然未知，但卻是客觀存在的固定值，因此可通過優化似然函式等準則來確定參考值；
貝葉斯學派（Bayesian）則認為引數是未觀察到的隨機變數，其本身也可有分佈，因此，可假定引數服從一個先驗分佈，然後基於觀測到的資料來計算引數的後驗分佈。

極大似然估計是頻率主義學派的經典方法~其思想就是目前出現的分佈是概率最大的分佈。
令Dc表示訓練D中第c類樣本組成的集合，假設這些樣本是獨立同分布的，則引數θc對於資料集Dc的似然是：

P(Dc|θc)=∏x∈DcP(x|θc)
極大似然就是P(Dc|θc)取最大值的時候的θc作為估計值。（╮(╯▽╰)╭哎，人類也是沒轍了啊，我們能怎麼辦，我們也很絕望啊）
上式連乘容易造成結果下溢，通常使用對數似然（log-likelihood）:
LL(θc)=logP(Dc|θc)=∑x∈Dc

機器學習----貝葉斯分類器（貝葉斯決策論和極大似然估計）

貝葉斯決策論

後驗概率最大化的意義

生成方法解決之道

極大似然估計

機器學習----貝葉斯分類器（貝葉斯決策論和極大似然估計）

【機器學習筆記08】分類器（softmax迴歸)

Opencv Python版學習筆記字元識別-分類器（SVM，KNearest，RTrees，Boost，MLP）

貝葉斯估計和極大似然估計到底有何區別

機器學習系列——樸素貝葉斯分類器（二）

機器學習：貝葉斯分類器（二）——高斯樸素貝葉斯分類器代碼實現

機器學習---樸素貝葉斯分類器（Machine Learning Naive Bayes Classifier）

《機器學習》周志華學習筆記第七章貝葉斯分類器（課後習題）python 實現

機器學習入門-貝葉斯分類器（一）

周志華《機器學習》之第七章（貝葉斯分類器）概念總結

《Spark機器學習》筆記——Spark分類模型（線性迴歸、樸素貝葉斯、決策樹、支援向量機）

貝葉斯分類器（二）

樸素貝葉斯分類器（Naive Bayes Classifiers）

機器學習筆記（一）：極大似然估計與貝葉斯估計的區別

情感分析方法之snownlp和貝葉斯分類器（三）

常用分類問題的演算法-樸素貝葉斯分類器（Naive Bayes Classifiers）

貝葉斯分類器（含MATLAB實現）

樸素貝葉斯分類器（Python實現）

貝葉斯分類器（一）

貝葉斯分類器(Python實現+詳細完整原始碼和原理)

機器學習----貝葉斯分類器（貝葉斯決策論和極大似然估計）

貝葉斯決策論

後驗概率最大化的意義

生成方法解決之道

極大似然估計

相關推薦