統計學假設檢驗(Hypothesis Testing)

阿新 • • 發佈：2019-01-15

什麼是假設檢驗：通過設定一個假設，然後通過收集資料、計算等操作來判斷這個假設是否成立。

假設檢驗的步驟：

1. 設定 null hypothesis 和 alternative hypothesis

2. 收集資料

3. 基於收集的資料，來判斷拒絕或者接受 null hypothesis ( 有兩種方法 1. Critical Value 2. P-Value)

值得注意的是：

H0 - null hypothesis

H1 - alternative hypothesis

1. 對於null hypothesis 和 alternative hypothesis 來說，常見的一共有一下幾種組合。

H0: μ >= μ0 H1: μ < μ0

H0: μ <= μ0 H1: μ > μ0

H0: μ = μ0 H1: μ != μ0

注意！ a). 對於H1僅僅只有這三種組合。 b). H1 和 H0 永遠是相反的 c).一個成功的假設檢驗的H0和H1的設定是至關重要！

2. significance value: 它是對null hypothesis 產生誤判的概率。如果value 為5%，那麼我們知道僅僅只有5%的情況下，null hypothesis 是真的但是我們卻拒絕了它。也就是說，我們有 95%(confidence level)的信心說 null hypothesis 是假的，所以我們拒絕它。當我們使用收集的資料計算出來的z-score 與5% 相對應的z-score相比較時，如果前者小於後者，那麼前者對應的概率會更小，換句話說，就是可能只有 1%的概率會發生對 null hypo 的誤判。這裡可能有點繞，但是仔細品味下會很清楚。另外什麼是Critical Value呢？我們已經有了, significance value 對應的我們可以根據critical value z table 找到相應的 value這個value就是critical value.

這裡涉及到了 Type I Error. -- H0 為真,但是被拒絕

3. p-value: 就是我們犯錯的概率, 換句話說, 就是我們假設 H0 是假, 然後我們拒絕它的概率. 所以我們期望我們犯錯的概率越小越好, 比較 p-valiue和 alpha的值, 如果p-value 值越大, 我們就該越謹慎,從未不拒絕 H0.

我們通過一個例題來學習。

背景：一個健身房對外宣稱在它這裡健身的顧客在兩週的鍛鍊之後會減掉 10 公斤，根據已收集的資料我們得知， 50 個顧客，平均減掉了 9 公斤，標準差為 2.8 公斤。那麼在 significance value 是 5%的情況下，我們能否推論顧客減掉的體重會小於 10 公斤？

1. 設定 null 和 alternative

H0: μ0 >= 10

H1: μ0 < 10

2. 使用收集的資料的資訊，並根據以下的公式計算 test statistic value. t = -2.53 但是z-score with 5% significance level = -1.645.

3.1) critical region 方法. 因為t < z-score 所以，對於null hypothesis 發生誤判的概率小於 5%。所以我們拒絕null hypothesis。得出結論顧客減掉的平均體重會小於 10 以上的值得注意的是：這個板塊中有介紹)

3.2) P- value方法. 根據計算出 test statistics = -2.53, 我們能使用z score table 找到相應的p-value值. 通過比較 p-value和significance value( 5%)

如果 p-value < 0.05, 我們拒絕null hypothesis

FYI:

統計學假設檢驗(Hypothesis Testing)

統計學假設檢驗(Hypothesis Testing)

假設檢驗(hypothesis testing)及P值(p-value)

統計學--假設檢驗過程

統計學假設檢驗中 p 值的含義具體是什麼？

假設檢驗（Hypothesis Testing）

電腦科學採用訓練資料集，驗證資料集，測試資料集的方法為什麼不採用統計學中常用的假設檢驗呢？（引數檢驗和非引數檢驗）

資料探勘基礎之統計學的假設檢驗實驗

統計學3—假設檢驗

應用統計學與R語言實現學習筆記（六）——假設檢驗

統計學的假設檢驗

描述統計學、推斷統計學、假設檢驗、計算person相關係數

【概率論與數理統計】小結10-1 - 假設檢驗概述

Udacity資料分析（進階）- 統計學：檢驗心理學現象

置信區間和假設檢驗的理解

【數理統計學習】統計假設檢驗

統計基礎之假設檢驗

Python假設檢驗

Python_4組資料看線性迴歸的假設檢驗問題

Python金融系列第四篇：置信區間和假設檢驗

【數學】假設檢驗求p值

統計學 假設檢驗(Hypothesis Testing)

相關推薦

統計學假設檢驗(Hypothesis Testing)