【數學基礎】無偏估計——為何樣本方差需要除以(n-1)?
相信在學習數理統計過程中,肯定很多人會下面這樣的疑問
為什麼樣本方差是除以(n-1),而不是除以n呢?
那麼今天就一起來看一下是為什麼。
##背景知識
為了方便後面的表述,我們用 Xˉ 表示樣本均值,用 S2 表示樣本方差,用 u 表示總體均值,用 σ2 表示總體方差。
總體方差
整體方差的求得過程如下;
σ2=D(X)=E((Xi−E(X))2)=E(Xi2−2XiE(X)+E(X)2)=n1(i=1∑n(Xi2)−2i=1∑nXiE(X)+nE(X)2)
由於∑i=1nXi=nE(X) ,所以可得;
σ2=D(X)=E((Xi−E(X))2)=n1(i=1∑n(Xi2)−nE(X)2)=E(X2)−E(X)2
樣本方差
S2=n−11i=1∑n(Xi−Xˉ)2
中心極限定理
設從均值為u,方差為σ2 的一個任意總體中抽取容量為n的樣本,當n 充分大的時候,樣本均值的抽樣分佈服從N(u,σ2/n) 的分佈,即;
E(Xˉ)D(Xˉ)=u=σ2/n
無偏估計
如果 θ^ 的期望等於 θ ,則稱 θ^ 是 θ 的無偏估計量,即
E(θ^)=θ
例如樣本均值Xˉ 是總體均值的無偏估計。
E(Xˉ)=n1i=1∑nE(Xi)=E(X)=u
所有的前期準備工作就此結束了。
判斷S2是否是σ2的無偏估計
先假設 S~2=n1∑i=1n(Xi−Xˉ)2;那麼求E(S~2) ;
E(S~2)=E(n1i=1∑n(Xi−Xˉ)2)=E(n1(i=1∑nXi2−nXˉ2))=n1(nE(X2)−nE(Xˉ2))
由於σ2=D(X)=E(X2)−E(X)2 ,且樣本均值服從N(u,σ2/n) 的分佈所以;
相關推薦
【數學基礎】無偏估計——為何樣本方差需要除以(n-1)?
相信在學習數理統計過程中,肯定很多人會下面這樣的疑問 為什麼樣本方差是除以(n-1),而不是除以n呢? 那麼今天就一起來看一下是為什麼。 ##背景知識 為了方便後面的表述,
為什麼樣本方差的分母是n-1?為什麼它又叫做無偏估計?
簡單的回答,是因為因為均值你已經用了n個數的平均來做估計在求方差時,只有(n-1)個數 和 均值資訊 是不相關的。而你的第n個數已經可以由前(n-1)個數和均值 來唯一確定,實際上沒有資訊量。所以在計算方差時,只除以(n-1)。那麼更嚴格的證明呢?請耐心的看下去。樣本方差計算
【數學基礎】引數估計之極大似然估計
背景 先來看看幾個小例子: 獵人師傅和徒弟一同去打獵,遇到一隻兔子,師傅和徒弟同時放槍,兔子被擊中一槍,那麼是師傅打中的,還是徒弟打中的? 一個袋子中總共有黑白兩種顏色100個球,其中一種顏色90個,隨機取出一個球,發現是黑球。那麼是黑色球90個?還是白色球90個? 看
【數學基礎】引數估計之貝葉斯估計
從統計推斷講起 統計推斷是根據樣本資訊對總體分佈或總體的特徵數進行推斷,事實上,這經典學派對統計推斷的規定,這裡的統計推斷使用到兩種資訊:總體資訊和樣本資訊;而貝葉斯學派認為,除了上述兩種資訊以外,統計推斷還應該使用第三種資訊:先驗資訊。下面我們先把是那種資訊加以說明。
【數學基礎】【歐拉定理模板】
技術分享 mage 個數 分享 cnblogs com 兩個 一個 一個數 先明確歐拉函數:計算任意給定的正整數n,在小於等於n的正整數中和n構成互質關系的正整數個數,比如φ(8) = 4,因為1,3,5,7都與8互質 性質1:n=1時,φ(1) = 1;
【 數學基礎】【素數線性篩法--歐拉篩法模板】【普通篩法的優化】
for ++ 自身 素數 spa prime pri 沒有 大於 質數(素數):指大於1的所有自然數中,除了1和自身,不能被其它自然數整除的數 合數:比1大,但不是素數的數稱為合數,合數除了被1和自身整除,還能被其它數整除 質因數(素因數或質因子):能整除給定正整數的質
【數學基礎】【歐拉定理模板】【費馬小定理】
基礎 int 復雜度 amp pan -1 log 分治 質數 費馬小定理:當p是一個質數時,且a和p互質,有ap-1=1(mod p) (歐拉定理的一種特殊情況) 歐拉定理:如果a和n互質,那麽aφ(n)=1(mod n) 對於任意a,b,n就有 ab=
【數學基礎】 協方差與協方差矩陣
##常見的統計量 在概率與統計中,最常見的統計量有樣本均值、方差、標準差、極差以及中位數等等。這些都是最基礎、最常見的統計量。 均值: Xˉ=1n∑i=1nXi\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_{i}
【數學基礎】最小二乘法
前言 當我們有NNN組資料,希望能夠用一個函式來擬合這組資料的分佈情況時,首先想到的就是最小二乘法。最小二乘法是線性迴歸中最基礎也是最常用模型,它也可以用來擬合高次多項式。 什麼是最小二乘法 那麼,什麼是最小二乘法呢?將我們手中已有的資料表示成一個集
【數學基礎】【尤拉定理模板】【費馬小定理】
費馬小定理:當p是一個質數時,且a和p互質,有ap-1=1(mod p) (尤拉定理的一種特殊情況) 尤拉定理:如果a和n互質,那麼aφ(n)=1(mod n) 對於任意a,b,n就有 ab=aφ(n)+b mod φ(n)(mod n) 處理b數值較大的情況 ,採
樣本方差的無偏估計與(n-1)的由來
一、無偏估計 所謂總體引數估計量的無偏性指的是,基於不同的樣本,使用該估計量可算出多個估計值,但它們的平均值等於被估引數的真值。 在某些場合下,無偏性的要求是有實際意義的。例如,假設在某廠商與某銷售商之間存在長期的供貨關係,則在對產品出廠質量檢驗方法的選擇上,採用隨
總體樣本方差的無偏估計樣本方差為什麼除以n-1
1)基本概念 我們先從最基本的一些概念入手。 如下圖,腦子裡要浮現出總體樣本,還有一系列隨機選取的樣本。只要是樣本,腦子裡就要浮現出它的集合屬性,它不是單個個體,而是一堆隨機個體集合。樣本是總體樣本中隨機抽取一系列個體組成的集合,它是總體樣本的一部分。 應該把樣本和
【CPP基礎】面向物件的程式設計思想 + 輸入和輸出相關(一)
引自高翔博士的《視覺SLAM十四將》: 用著用著才發現C++和Linux才是我的真愛。 開始做人工智慧和人工智慧相關的人和團體越來越多,雖然初期學習中會發現對於絕大多數沒有什麼程式設計基礎的人來說Python是一個非常便於上手的語言,而且甚多開源構架都有基於Pytho
【第二篇】ASP.NET MVC快速入門之數據註解(MVC5+EF6)
red 數據庫結構 varchar model 菜單 錯誤提示 edi 還需 問題 目錄 【第一篇】ASP.NET MVC快速入門之數據庫操作(MVC5+EF6) 【第二篇】ASP.NET MVC快速入門之數據註解(MVC5+EF6) 【第三篇】ASP.NET MVC快速入
【AI實戰】手把手教你訓練自己的目標檢測模型(SSD篇)
目標檢測是AI的一項重要應用,通過目標檢測模型能在影象中把人、動物、汽車、飛機等目標物體檢測出來,甚至還能將物體的輪廓描繪出來,就像下面這張圖,是不是很酷炫呢,嘿嘿 在動手訓練自己的目標檢測模型之前,建議先了解一下目標檢測模型的原理(見文章:大話目標檢測經典模型RCNN、Fast RCN
【Kaggle筆記】預測泰坦尼克號乘客生還情況(決策樹)
資料集 程式碼 # -*- coding: utf-8 -*- """ 泰坦尼克號乘客生還情況預測 模型 決策樹 """ # 匯入pandas用於資料分析。 import panda
【資料結構】稀疏矩陣的壓縮儲存和轉置演算法(C++程式碼)
一 稀疏矩陣的定義 矩陣是如今很多科學與工程計算問題中常用的數學物件,矩陣涉及到的計算通常會出現矩陣的階數比較高但是非零元素的個數卻比較少的情況,因此,我們需要有一種方法來壓縮這種比較稀疏的矩陣。 那麼,首先第一個問題就是如何定義一個矩陣是否是稀疏的?參考嚴蔚敏的資料結構教
【開發工具】壓力測試:2、Jmeter的安裝使用(TCP測試)
一、工具介紹 Apache JMeter是Apache組織開發的基於Java的壓力測試工具,用於對軟體做壓力測試,它最初被設計用於Web應用測試但後來擴充套件到其他測試領域。 它可以用於測試靜態和動態資源例如靜態檔案、Java小服務程式
迴歸分析中的引數估計為何是最小二乘法(least squares),不是最小一乘法(least absolute deviations)
如題,面試被問到了。今天網上找了些資料,整理了一下。 迴歸分析就是找到一條最合適的擬合線來逼近所有的觀測點。如何衡量擬合的好壞程度呢,直接地,就是看擬合值與觀測值之間的距離了。在這種情況下,我們直接用擬合值與觀測值差的絕對值就可以衡量誤差(如公式1),為什麼要用差的平方呢(
【caffe-windows】 caffe-master 之 卷積核可視化(利用matlab)
前期準備,需要兩個東西 1. 模型的描述檔案 deploy.prototxt 2. 模型本身lenet_iter_10000.caffemodel (此處用的examples中的mnist裡的) 第一步: 在建立D:\caffe-master\m