1. 程式人生 > >統計學 假設檢驗(Hypothesis Testing)

統計學 假設檢驗(Hypothesis Testing)

什麼是假設檢驗: 通過設定一個假設, 然後通過收集資料、計算等操作來判斷這個假設是否成立。

假設檢驗的步驟:

1. 設定 null hypothesis 和  alternative hypothesis

2. 收集資料

3. 基於收集的資料,來判斷 拒絕 或者 接受 null hypothesis  ( 有兩種方法 1. Critical Value  2. P-Value)

值得注意的是:

H0 - null hypothesis

H1 - alternative hypothesis

1. 對於null hypothesis 和 alternative hypothesis 來說,常見的一共有一下幾種組合。

H0: μ >= μ0   H1: μ < μ0

H0: μ <= μ0   H1: μ > μ0

H0: μ = μ0     H1:  μ != μ0

注意! a). 對於H1僅僅只有這三種組合。    b). H1 和 H0 永遠是相反的 c).一個成功的假設檢驗的H0和H1的設定是至關重要!

2. significance value: 它是 對null hypothesis 產生誤判的概率。 如果value 為5%, 那麼我們知道   僅僅只有5%的情況下,null hypothesis 是真的但是我們卻拒絕了它。 也就是說,我們有 95%(confidence level)的信心說 null hypothesis 是假的,所以我們拒絕它。當我們使用  收集的資料計算出來的z-score  與5% 相對應的z-score相比較時,如果前者小於後者,那麼前者對應的概率會更小,  換句話說,就是可能只有 1%的概率會發生對 null hypo 的誤判。這裡可能有點繞,但是仔細品味下會很清楚。  另外什麼是Critical Value呢?我們已經有了,  significance value 對應的我們可以根據critical value z table 找到相應的 value這個value就是critical value.

這裡涉及到了 Type I Error. --  H0 為真,但是被拒絕

3. p-value: 就是 我們犯錯的概率,  換句話說, 就是 我們假設 H0 是假, 然後我們拒絕它 的概率. 所以我們期望 我們犯錯的概率越小越好, 比較 p-valiue和 alpha的值,  如果p-value 值越大, 我們就該越謹慎,從未不拒絕 H0.

我們通過一個例題來學習。

背景:  一個健身房對外宣稱在它這裡健身的顧客在兩週的鍛鍊之後會減掉 10 公斤, 根據已收集的資料我們得知, 50 個顧客,平均減掉了 9 公斤,標準差為 2.8 公斤。那麼在 significance value 是 5%的情況下,我們能否推論 顧客減掉的體重 會小於 10 公斤?

1. 設定 null 和 alternative

 H0: μ0 >= 10

 H1: μ0 < 10

2. 使用收集的資料的資訊,並根據以下的公式計算 test statistic value.  t = -2.53     但是z-score with 5% significance level = -1.645.

 

3.   

3.1)  critical region 方法. 因為t < z-score 所以,對於null hypothesis 發生誤判的概率小於 5%。 所以我們拒絕null hypothesis。 得出結論 顧客減掉的平均體重會小於 10 以上的 值得注意的是: 這個板塊中有介紹)

3.2) P- value方法. 根據計算出 test statistics = -2.53, 我們能使用z score table 找到相應的p-value值. 通過比較 p-value和significance value( 5%) 

如果 p-value < 0.05, 我們拒絕null hypothesis 

FYI:


相關推薦

統計學 假設檢驗(Hypothesis Testing)

什麼是假設檢驗: 通過設定一個假設, 然後通過收集資料、計算等操作來判斷這個假設是否成立。 假設檢驗的步驟: 1. 設定 null hypothesis 和  alternative hypothe

假設檢驗(hypothesis testing)及P值(p-value)

前一篇t檢驗的文末提到了P值的概念,P值實際上是醫學統計中很常用的一個概念,那麼這篇文章繼續講解什麼是P值。說到P值,就得先從假設檢驗說起。 首先宣告,此篇的內容是來自"馬同學高等數學"微信公眾號的內容。 目錄 2、P值 參考文獻: 1、什麼是假

統計學--假設檢驗過程

假設檢驗原理 基礎:小概率原理,即一般認為小概率事件在一次隨機抽樣中不會發生。 基本思想:先建立一個關於樣本所屬總體的假設,考察在假設條件下隨機樣本的特徵資訊是否屬小概率事件,若為小概率事件,則懷疑

統計學假設檢驗中 p 值的含義具體是什麼?

就從打賭開始說起。 一日閒機無聊,我與樓主會飲於望胡樓。飲罷,兩人都不想主動買單,於是我提議以置硬幣來決定誰買單。 規則是這樣的:有二十個一元硬幣,誰的菊花朝上多,誰就算贏。 然後樓主先投,有十一個硬幣菊花朝上。 他就得意洋洋的看我。 然後我一扔,有十九個硬幣個個菊花朝天。 樓主角色由紅轉白,由白轉黑。 拍

假設檢驗Hypothesis Testing

基本思想 ddc 控制 .com bcd 樣本 course bbf 正態分布 什麽是假設檢驗   假設檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。其基本原理是先對總體的特征作出某種假設,然後通過抽樣研究的統計推理,對此假

電腦科學採用訓練資料集,驗證資料集,測試資料集 的方法 為什麼不採用統計學中常用的假設檢驗呢? (引數檢驗 和 非引數檢驗

如題所說, 這個問題作為一個本科讀管理,碩士讀計算機卻旁修經濟學,博士在讀計算機的我來說感覺比較迷惑的。在管理學,經濟學,計算機這三門學科在解決優化問題的時候採用的方法大致相同,其核心都是統計學,管理學,電腦科學中採用的基礎方法,如線性迴歸,多元線性迴歸,廣義線性迴歸,決策樹,SVM,ID3,KNN等分類方法

資料探勘基礎之統計學假設檢驗實驗

本部落格根據非常好的excel資料而編寫,使用python語言操作,預計使用一週的時間更新完成。需要《非常好的excel資料》word文件,歡迎發郵件給[email protected],免費發放。這篇部落格對應《非常好的excel資料》裡的第3章節。 1.假設檢驗實驗 1

統計學3—假設檢驗

文章目錄 假設檢驗步驟 Z 統計量與t 統計量 I型錯誤和II型錯誤 隨機變數之差的方差 樣本均值之差的分佈 總體佔比置信區間 假設檢驗步驟 確定要進行襝驗的假設 原假設

應用統計學與R語言實現學習筆記(六)——假設檢驗

Chapter 6 Hypothesis Test 本篇是第6章,內容是假設檢驗。 1.基本思想 我們還是從問題開始討論。這回提個接地氣的問題——雄安新區批覆前後對該地區房價是否有差異? 嗯,假設檢驗其實就是為了解決這類問題。 假設檢驗的基本

統計學假設檢驗

1.什麼是假設檢驗? 假設檢驗是一種規則,它根據資料樣本所提供的證據,指定是肯定還是否定有關總體的宣告。基本原理是先對總體的特徵作出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。 2.假設檢驗的基本思想 假設檢驗的基

描述統計學、推斷統計學假設檢驗、計算person相關係數

''' 描述統計學 –集中趨勢 –離散趨勢 –偏態 假設檢驗 –基本原理 –基本概率 統計學可以分為:描述統計學與推斷統計學 描述統計學:使用特定的數字或圖表來體現資料的集中程度和離散程度。例:每次考試算的平均分,最高分,各個分段的人數分佈等,也是屬於描述統計學的範圍

【概率論與數理統計】小結10-1 - 假設檢驗概述

sqrt htm get 依據 事件 http 例如 style 科學 註:終於寫到最激動人心的部分了。假設檢驗應該是統計學中應用最廣泛的數據分析方法,其中像"P值"、"t檢驗"、"F檢驗"這些如雷貫耳的名詞都來自假設檢驗這一部分。我自己剛開進入生物信息學領域,用的最多的就

Udacity資料分析(進階)- 統計學檢驗心理學現象

統計學:檢驗心理學現象 背景資訊 在一個Stroop (斯特魯普)任務中,參與者得到了一列文字,每個文字都用一種油墨顏色展示。參與者的任務是將文字的列印顏色大聲說出來。這項任務有兩個條件:一致文字條件,和不一致文字條件。在一致文字條件中,顯示的文字是與它們的列印顏色匹配的顏色詞,如“

置信區間和假設檢驗的理解

置信區間和假設檢驗的理解 更新答案 數學理論的引入很大程度上是為了解決實際問題,或者是提供一種看待和理解現實世界的方式 置信區間(解決根據樣本推能夠相信的範圍):如果男女地位的主張是從一個極端男權到極端女權一個連續變化的值的話,人群(富強民主文明和諧美麗群體,主張男女平

【數理統計學習】統計假設檢驗

統計假設檢驗可分為引數假設檢驗和非引數假設檢驗兩大部分。 當總體分佈形式已知,檢驗的目的是對總體的引數及其性質作出判斷,則稱這種檢驗為引數假設檢驗。 若總體分佈形式未知,需對總體分佈函式形式或總體之間的關係進行推斷,則稱為非引數假設檢驗。 顯著性檢驗:先提出假設,然後作出否定或者不否定的判斷,稱為顯著性

統計基礎之假設檢驗

原假設:,定義與備擇假設完全相反的內容稱為原假設。 備擇假設:,將試圖建立的結果設為備擇假設。 第一類錯誤:當為真時,做出拒絕的結論 第二類錯誤:當為真時,卻接受了。 1、總體均值的檢驗:已知   下側檢驗 上側檢驗

Python假設檢驗

import pandas as pd import pylab import math import numpy as np import matplotlib.pyplot as plt %matplotlib inline from scipy.stats import

Python_4組資料看線性迴歸的假設檢驗問題

一般情況下,當H0:β1=0H_0: \beta_1 = 0H0​:β1​=0 被接受的時候,表明 yyy 的取值傾向不隨 xxx 的值按線性關係變化。這種情況的原因可能是變數 yyy 與 xxx 之間

Python金融系列第四篇:置信區間和假設檢驗

作者:chen_h 微訊號 & QQ:862251340 微信公眾號:coderpai 第五篇:多元線性迴歸和殘差分析 第六篇:現代投資組合理論 第七篇:市場風險 第八篇:Fama-French 多因子模型 介紹 在上一章中,我們討論了隨機變

【數學】假設檢驗求p值

1. 不存在p檢驗,只有Z檢驗、T檢驗、卡方檢驗、U檢驗等,這些檢驗都有p值。 2. t檢驗只有當確定資料分佈為正態分佈時才用;獨立重複實驗得到結果可假設為服從正態分佈(存疑);同樣是t檢驗,也分