機器學習中的偏差和方差

阿新 • • 發佈：2018-12-13

當一個模型確定時，我們需要對其進行診斷，判斷這個模型是否存在過擬合或者欠擬合。通過偏差與方差我們可以很快捷的評價當前的模型。

偏差與方差的直觀理解

偏差：就是偏離的意思，與“標準”之間的差距。 方差：是離散程度，波動程度的意識。

在這裡插入圖片描述

圖1，2的偏差都比較小（都能在靶心的範圍內），但是圖1的方差更小（資料集中），而圖2則方差更大（資料發散）。圖3，4的偏差都比較大（已經脫離了靶心位置）

從機器學習方面理解：

偏差：反映的是模型的擬合能力方差：反映的是模型的泛化能力

在機器學習中評價模型通常用代價函式 $J$ , $J_{train}$ 表示訓練的誤差， $J_{val}$

val表示驗證時誤差，通過

J_{train}

、

J_{val}

可以得出模型的偏差與方差情況。

高偏差對應著 $J_{train}$ 、 $J_{val}$ 都大，並且 $J_{train}$ 約等於 $J_{val}$ ，這意味著欠擬合。高偏差對應著 $J_{train}$ 較小，而 $J_{val}$ 遠大於 $J_{train}$ ，這意味著過擬合。在這裡插入圖片描述

當模型屬於高偏差（欠擬合）時，不斷增大訓練的資料規模，模型效能不會有什麼改善，因為欠擬合一般是模型比較簡單，不能準確描述資料的特徵，因此盲目增大資料量是沒什麼用。當模型資料低偏差，高方差（過擬合），不斷增大訓練資料模型，過擬合誤差會逐漸減少，因為過擬合是因為模型複雜，描述資料的特徵過於精準，所以增大資料量能減少過擬合。

機器學習中的偏差和方差

機器學習基礎--偏差和方差

機器學習：偏差、方差與正則化

機器學習中的協方差矩陣的深入理解（簡單舉例）

機器學習：偏差、方差與欠擬合、過擬合

機器學習中的偏差和方差

Machine Learning第六講[應用機器學習的建議] --（二）診斷偏差和方差

【機器學習】交叉驗證，K折交叉驗證的偏差和方差分析

機器學習入門系列03，Error的來源：偏差和方差(bias和variance)

28.通過學習曲線診斷偏差和方差翻譯自吳恩達新書-Machine Learning Yearning

深度學習基礎系列（八）| 偏差和方差

從整合學習到模型的偏差和方差的理解

Spark機器學習中ml和mllib中矩陣、向量

20. 偏差和方差的概念及用途翻譯自吳恩達新書-Machine Learning Yearning

【通俗易懂】機器學習中 L1 和 L2 正則化的直觀解釋

概率統計與機器學習：期望，方差，數學期望，樣本均值，樣本方差之間的區別

線性迴歸中偏差，方差權衡

漫談：機器學習中距離和相似性度量方法

資料探勘和機器學習中距離和相似度公式

關於機器學習中Precision和Recall的概念的理解

估計、偏差和方差

機器學習中的偏差和方差

相關推薦