numpy中方差var、協方差cov求法

阿新 • • 發佈：2019-01-15

在PCA中涉及到了方差var和協方差cov，下面詳細瞭解這兩個函式的用法。numpy中var和cov函式求法和MATLAB中var和cov函式求法類似。

首先均值，樣本方差，樣本協方差公式分別為

樣本的方差，而是整個空間的方差。

下面就介紹MATLAB中var和cov函式的用法

函式名稱：cov

函式功能：求協方差矩陣

函式用法： cov(X) % cov(X,0) = cov(X)

cov(X,Y) % X,Y必須是各維數都相同的矩陣
cov(X,1) % 除以N而不是N-1

cov(X,Y,1) % 除以N而不是N-1
詳細描述：
......................................................................
if X is a vector向量，cov(X)輸出的是這個向量的方差

例：

>> A = [4 1 3];
>> AA = cov(A)

AA =

2.3333

>> a = mean(A)

a =

2.6667

>> AAA = 1/3*((4-a)^2+(1-a)^2+(3-a)^2)

AAA =

1.5556

>> AAAA= 1/2*((4-a)^2+(1-a)^2+(3-a)^2) %同樣，這個方差不是真正意義的方差，而是對樣本統計方差的一個無偏估計值

AAAA =

2.3333

..............................................................................

對於矩陣來說，matlab把每行看做一個觀察值，把每列當做一個變數，也就是說對於一個4*3的矩陣求協方差矩陣，matlab會認為存在三個變數，即會求出一個3*3的協方差矩陣。
其中，對角線元素為對應變數的方差無偏估計值，其他位置為對應變數間的協方差無偏估計值（即除的是N-1）

.......................................................................
例1：
>> X = [1 5 6; 4 3 9 ; 4 2 9; 4 7 2]

X =

     1     5     6
     4     3     9
     4     2     9
     4     7     2

>> Y = cov(X)

Y =

    2.2500   -0.7500    0.5000
   -0.7500    4.9167   -7.1667
    0.5000   -7.1667   11.0000

為探究過程，以Y(1,1)和Y（1,2）為例進行驗證

>> x=X(:,1);
>> sum((x-3.25).^2)/3

ans =

2.2500

>> y = X (:,2);

>> aa = x'*y/3

aa =

-0.7500

......................................................

對於cov(X,Y)

X、Y必須是各維數都相等的矩陣，其功能是把X中所有元素看做一個變數的樣本，Y中所有元素看做另外一個變數的樣本，把矩陣中每個對應位置看做一個聯合觀察值

函式實現的是求出兩個變數的協方差矩陣

例2：

>> X

X =

     1     5     6
     4     3     9
     4     2     9
     4     7     2
>> Y = [1 6 7; 7 5 9 ; 1 6 4 ; 2 9 2]

Y =

     1     6     7
     7     5     9
     1     6     4
     2     9     2
>> cov(X,Y)

ans =

6.9697 4.4242
4.4242 8.4470

現在用（1,1）和（1,2）位置驗證

>> sum(sum((X-mean(mean(X))).^2))/11 %把X中每個元素都看做一個變數的樣本，求其方差的無偏估計值

ans =

6.9697

>> sum(sum((X-mean(mean(X))).*(Y-mean(mean(Y)))))/11 %把X、Y矩陣對應位置元素看做一個聯合樣本，根據公式E[(X-EX)*(Y-EY)]求協方差

ans =

4.4242

.....................................................................................

cov(X,1) 和 cov(X,Y,1) 與之前的求解過程一致，不同的是，其求出的是協方差，而不是樣本的協方差無偏估計值，即其除以的是N 而不是N-1

例3：

>> cov(X,1)

ans =

    1.6875   -0.5625    0.3750
   -0.5625    3.6875   -5.3750
    0.3750   -5.3750    8.2500

>> x=X(:,1);
sum((x-3.25).^2)/4 %不同之處

ans =

1.6875

>> y = X (:,2);
>> y = y - 4.25;
>> aa = x'*y/4 %不同之處

aa =

-0.5625

例4：

X =

     1     5     6
     4     3     9
     4     2     9
     4     7     2
>> Y = [1 6 7; 7 5 9 ; 1 6 4 ; 2 9 2]

Y =

     1     6     7
     7     5     9
     1     6     4
     2     9     2

>> cov(X,Y)

ans =

6.9697 4.4242
4.4242 8.4470

>> a =cov(X,Y,1)

a =

6.3889 4.0556
4.0556 7.7431

>> a.*12/11 %看出來了吧

ans =

6.9697 4.4242
4.4242 8.4470

協方差矩陣計算的是不同維度之間的協方差，而不是不同樣本之間的。理解協方差矩陣的關鍵就在於牢記它計算的是不同維度之間的協方差，而不是不同樣本之間，拿到一個樣本矩陣，我們最先要明確的就是一行是一個樣本還是一個維度，心中明確這個整個計算過程就會順流而下，這麼一來就不會迷茫了~

numpy中方差var、協方差cov求法

numpy中方差var、協方差cov求法

numpy中的方差、協方差、相關系數

標準差、方差、協方差的簡單說明

均值、方差、協方差等定義與基本運算

均方誤差、平方差、方差、均方差、協方差（轉）

協方差、協方差矩陣的數學概念及演算法計算

期望、方差、協方差、標準差

方差、協方差

統計學習方法——均值、方差、標準差及協方差、協方差矩陣

機器學習之數學基礎——期望、方差、協方差、相關係數、矩、協方差矩陣

標準差、方差、協方差的區別

概率統計：數學期望、方差、協方差、相關係數、矩

概率論基礎知識整理：概率分佈、邊緣/條件概率、期望、協方差

分類-3-生成學習-2-高斯判別分析、協方差

oracle資料庫之統計分析（方差、標準差、協方差）

標準差、方差、協方差三者的表示意義

方差與樣本方差、協方差與樣本協方差

期望、方差、標準差、偏差、協方差和協方差矩陣

方差、協方差、期望、相關係數等概念集合

Mathematics Base - 期望、方差、協方差、相關系數總結

numpy中方差var、協方差cov求法

相關推薦