1 簡單迴歸

1.1 線性迴歸殘差性質

線性迴歸想必大家都比較熟悉了, 其迴歸方程是y^i=β^0+β^1xi
殘差是：ei=yi−y^i=yi−β^0−β^1xi.
殘差有以下性質：

∑i=1Nei=0and∑i=1Nxiei=0.
其殘差為白噪聲且與自變數沒有關係

1.2 迴歸與相關性

迴歸與相關性有較大的關係,設相關係數為r,sy,sx分別為y和x的觀測值，他滿足下式：

β^1=rsysx,
可以看出線性迴歸將相關性聯絡起來

1.3 迴歸模型的評估

1.3.1 殘差圖繪製

繪製殘差圖能夠清晰地看到那一段擬合的比較好，也能夠看到異常點
這裡寫圖片描述
上圖中可以看出在開始小於20 大於35的地方擬合的不好

1.3.2 異常值觀測

異常的檢測方法很多，有監督，半監督，無監督等方法，有機會可以好好看下，本書中沒有詳細介紹。

1.3.3 擬合情況評價

評價線性擬合的擬合情況可以用決定係數R2來評價

R2=∑(y^i−y¯)2∑(yi−y¯)2
其中觀測值是y,帶帽子的y是預測值
它的值越接近1越好，在0-1之間,。

但是：
並不是總是越大越好，如上面的圖，在某一段會有擬合不充分的地方
簡單的線性迴歸中R2等於相關係數的平方。

判定係數只是說明列入模型的所有解釋變數對因變數的聯合的影響程度，不說明模型中單個解釋變數的影響程度。
對時間序列資料，判定係數達到0.9以上是很平常的；但是，對截面資料而言，能夠有0.5就不錯了

。

還有一種方法叫做殘差標準差，也叫Standard error of the regression迴歸標準差

se=1N−2∑i=1Ne2i−−−−−−−−−−⎷
主要到，這裡除了n-2，而不是n-1，這是因為我們擬合了兩個引數（斜率和截距）

1.4 預測

注意預測不單單是一個值，應該是一個區間，即數值+置信區間的波動範圍

y^±1.96se1+1N+(x−x¯)2(N−1)s2x−−−−−−−−−−−−−−−−√,上式代表95%的置信區間的預測區間N代表樣本數量，s2x代表x的標準差

1.5 統計推斷

可以使用假設檢驗來識別判斷擬合的引數的正確性。
這裡使用P值來表明在原假設成立時，發生的概率
統計學根據顯著性檢驗方法所得到的P 值，一般以P < 0.05 為顯著， P <0.01 為非常顯著，其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 或0.01。實際上，P 值不能賦予資料任何重要性，只能說明某事件發生的機率。
若X 服從正態分佈和t 分佈，其分佈曲線是關於縱軸對稱的，故其P 值可表示為P = P{| X| > C} 。
計算出P 值後，將給定的顯著性水平α與P 值比較，就可作出檢驗的結論:如果α > P 值，則在顯著性水平α下拒絕原假設。如果α ≤ P 值，則在顯著性水平α下接受原假設。在實踐中，當α = P 值時，也即統計量的值C 剛好等於臨界值，為慎重起見，可增加樣本容量，重新進行抽樣檢驗。
具體推導公式本書未包含。可以查詢其他資料學習。

1.6 非線性擬合

線性擬合不好的情況可以用非線性擬合，適當的將變數進行數值變化之後可以用線性變化的理論來擬合非線性的問題，如選用log-log模型
logyi=β0+β1logxi+εi.

1.7 時間序列迴歸

時間序列可以用前面講到的判斷法，但是往往效果不好，這裡介紹了簡單的時間序列的迴歸
yt=β0+β1t+εt.
它以時間t為自變數，當然迴歸之後還需要計算殘差和ACF，如果ACF顯示不是白噪聲，說明有內在的聯絡為挖掘，它的預測精度可能不夠。

偽迴歸

這裡寫圖片描述
如圖，幾內亞的大米產量和澳大利亞的乘客數量看起來有相同的趨勢，但實際上是沒有關係的。如果直接用這樣的資料來判斷他們的關係久可能會造成偽迴歸。這常常是因為時間序列不穩定造成的。

2 多元迴歸

2.1 多元線性迴歸簡介

他的一般公式如下：

yi=β0+β1x1,i+β2x2,i+⋯+βk

時間序列 R 讀書筆記 Forecasting: principles and practice 06 迴歸概述

1 簡單迴歸

1.1 線性迴歸殘差性質

1.2 迴歸與相關性

1.3 迴歸模型的評估

1.3.1 殘差圖繪製

1.3.2 異常值觀測

1.3.3 擬合情況評價

1.4 預測

1.5 統計推斷

1.6 非線性擬合

1.7 時間序列迴歸

偽迴歸

2 多元迴歸

2.1 多元線性迴歸簡介

時間序列 R 讀書筆記 Forecasting: principles and practice 06 迴歸概述

暗時間的一些讀書筆記

時間序列方面的筆記

《python資料分析和資料探勘》——時間序列分析學習筆記

【Python】《Python編程之美最佳時間指南》讀書筆記

R讀書筆記之特徵工程（一）空值處理

時間序列 R 09 ARIMA

Operating Systems Principles and Practice 2nd 2Ch Exercises

Computer Graphics Principles And Practice

時間序列分析及應用 R語言讀書筆記 02

時間序列分析及應用 R語言讀書筆記 03

R語言學習筆記（十三）：時間序列

R語言學習筆記：時間序列分析

R語言與時間序列學習筆記（1）

有關時間序列的完整教程——R and Python

R語言與時間序列學習筆記（2）

《時間序列分析及應用.R語言》第十一章閱讀筆記

《R實戰》讀書筆記二

R語言--時間序列分析步驟

時間序列2擬合檢驗和預測#R

時間序列 R 讀書筆記 Forecasting: principles and practice 06 迴歸概述

1 簡單迴歸

1.1 線性迴歸殘差性質

1.2 迴歸與相關性

1.3 迴歸模型的評估

1.3.1 殘差圖繪製

1.3.2 異常值觀測

1.3.3 擬合情況評價

1.4 預測

1.5 統計推斷

1.6 非線性擬合

1.7 時間序列迴歸

偽迴歸

2 多元迴歸

2.1 多元線性迴歸簡介

相關推薦