1. 程式人生 > >統計基礎知識

統計基礎知識

憑藉記憶和百度複習一下以前學的,不斷更

1:統計學三大分佈,呵呵,沒有正態,F,T,卡方分佈

F分佈(F檢驗)用來檢驗方差齊性,可用直方圖和p-p圖來檢驗(spss/R),如果方差隨自變數x變大而變大,說明方差不齊,各個樣本的資料可能不是來自一個整體,

比如汽車擁有量,大城市的樣本多,小城市樣本少,人口對於模型的影響較大,因此要做一個修正。。或者改用非引數檢驗

關於正態性檢驗,先可以畫個直方圖,樣本量大於50看SW檢驗,樣本量小於50看KS檢驗

 T分佈:自由度ν越小,t分佈曲線越低平;自由度ν越大,t分佈曲線越接近標準正態分佈(u分佈)曲線。t分佈其實是由正態分佈和卡方分佈共同推導而來的,它的思路是樣本的均值服從正態分佈,而實際方差不能僅僅簡單等同於樣本中計算來的方差,要等同於一個服從卡方分佈的方差,最後推匯出了t分佈。t分佈中也有自由度的概念,往往取樣本數減去1為自由度v。

卡方分佈:若干個隨機變數的平方和服從卡方分佈,用來檢驗隨機變數是否服從其給定的概率的,服從某種分佈的。貌似在列聯表裡有用到。

T檢測:應用於小樣本的情況。中心極限定理告訴我們隨著樣本的容量變大,樣本的均值將成正態分佈,而當樣本較小的時候分佈則更接近t分佈。

 

協方差:表示X, Y 相互關係的數字特徵,cov(X, Y) = E(X-EX)(Y-EY),當 cov(X, Y)>0時,表明 X與Y 正相關;當 cov(X, Y)<0時,表明X與Y負相關;當 cov(X, Y)=0時,表明X與Y不相關。

相關係數:X、Y的協方差除以X的標準差和Y的標準差(相關係數也可以看成協方差:一種剔除了兩個變數量綱影響、標準化後的特殊協方差)

變異係數:將離散程度標準化,等於均值除以方差

大數定律:當N很大,樣本均值約等於期望

中心極限定律:不管什麼分佈,獨立隨機變數的均值分佈趨近於正態分佈

正態分佈的再生性:隨機變數X1,X2,相互獨立,服從正態分佈,則,Y=X1+X2 服從正態分佈

泊松分佈:一段時間內或者一定空間內事件的發生次數的對應概率。