1. 程式人生 > >統計學假設檢驗中 p 值的含義具體是什麼?

統計學假設檢驗中 p 值的含義具體是什麼?

就從打賭開始說起。

一日閒機無聊,我與樓主會飲於望胡樓。飲罷,兩人都不想主動買單,於是我提議以置硬幣來決定誰買單。
規則是這樣的:有二十個一元硬幣,誰的菊花朝上多,誰就算贏。
然後樓主先投,有十一個硬幣菊花朝上。
他就得意洋洋的看我。
然後我一扔,有十九個硬幣個個菊花朝天。

樓主角色由紅轉白,由白轉黑。
拍案而起,大吼一聲,你丫作弊,硬幣有問題!
我笑而不語問樓主:憑什麼說硬幣有問題?

難道二十個硬幣中十九個硬幣菊花朝上就根本不可能麼?顯然理論上是可能的,但是樓主依舊會認為我在作弊,實際上,任何人見到這個的場景都會懷疑背後有貓膩。

因為樓主或其他任何人都知道:假如這場打賭是公平的話,那麼每一個硬幣的兩面都有相等的
概率向上,所以每個硬幣菊花朝上的概率都是1/2也就是0.5,那麼十九個菊花朝上的概率是20/1048576,約等於0.00002。

這種概率太小了,樓主認為在假如我沒有在硬幣上做手腳以讓結果有利於我的話是不可能發生這種情況的。

我立刻反駁說,你這是嫉妒我,那我要扔出二十個菊花朝上你還不是要說我也在作弊?


樓主說,沒錯,我既然認為你扔出十九個菊花朝上是在作弊,那二十個菊花朝上當然也是因為你對硬幣動了手腳!

讓我們用統計學的語言概括一下。

H0:我沒有對硬幣動手腳。
H1:我對硬幣動了手腳,以讓結果偏向於我。

(這裡面的H0稱之為檢驗假設,意思是說你要檢驗的這個假設,H1稱之為備擇假設。他們兩的關係是不能相容的。這兩者只能且必須拒絕一個。假如拒絕H0的話,那麼就不能拒絕H1了。)

於是我們做了一個實驗(賭博)。

結果出現了十九個硬幣菊花朝上的情況。假如賭博是公平的,那麼出現這種情況的概率是20/1048576。而比這種情況更加極端的二十個硬幣統統朝上的概率是1/1048576,這種概率更加低。

假如我們認為十九個硬幣朝上是個小概率事件的話,那麼比它更極端的二十個硬幣朝上是一個更加極端的更小概率事件。

這兩者的和是21/1048576。

於是樓主認為在這麼一次實驗(賭博)當中出現這麼個小概率事件或者比它更極端的事件是不肯能的。

於是只能拒絕H0,於是不能拒絕H1。

也就是說我對硬幣動了手腳,以讓結果偏向於我。

以上就是假設檢驗的基本思想,裡面涉及到了樓主的一個問題,什麼是p值?

這裡的p值等於21/1048576,p值就是假如賭博是公平的,那麼出現這種情況和比這種情況更極端的概率值。

翻譯成乾巴巴的語言就是在H0成立的條件下,出現該實驗結果或更極端情況的概率值。

『H0成立的條件下,出現該實驗結果的概率值。』p 值定義應該還是在 H0條件下,出現現在結果和比現在結果偏離更遠的概率值吧

二、


三、

作者:吉米多維奇
連結:https://www.zhihu.com/question/23149768/answer/31704861
來源:知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。

其實理解起來很簡單,基本原理只有3個:1、一個命題只能證偽,不能證明為真2、在一次觀測中,小概率事件不可能發生 3、在一次觀測中,如果小概率事件發生了,那就是假設命題為假


證明邏輯就是:我要證明命題為真->證明該命題的否命題為假->在否命題的假設下,觀察到小概率事件發生了->否命題被推翻->原命題為真->搞定。

結合這個例子來看:證明A是合格的投手-》證明“A不是合格投手”的命題為假-》觀察到一個事件(比如A連續10次投中10環),而這個事件在“A不是合格投手”的假設下,概率為p,小於0.05->小概率事件發生,否命題被推翻。

可以看到p越小-》這個事件越是小概率事件-》否命題越可能被推翻-》原命題越可信

---------------------

這個過程實際上和人腦的做判斷的過程很相似

四、


五、