如何在python中實現線性迴歸

阿新 • • 發佈：2020-08-12

線性迴歸是基本的統計和機器學習技術之一。經濟，電腦科學，社會科學等等學科中，無論是統計分析，或者是機器學習，還是科學計算，都有很大的機會需要用到線性模型。建議先學習它，然後再嘗試更復雜的方法。

本文主要介紹如何逐步在Python中實現線性迴歸。而至於線性迴歸的數學推導、線性迴歸具體怎樣工作，引數選擇如何改進迴歸模型將在以後說明。

迴歸

迴歸分析是統計和機器學習中最重要的領域之一。有許多可用的迴歸方法。線性迴歸就是其中之一。而線性迴歸可能是最重要且使用最廣泛的迴歸技術之一。這是最簡單的迴歸方法之一。它的主要優點之一是線性迴歸得到的結果十分容易解釋。那麼迴歸主要有：

簡單線性迴歸
多元線性迴歸

多項式迴歸

如何在python中實現線性迴歸

用到的packages

NumPy

NumPy是Python的基礎科學軟體包，它允許在單維和多維陣列上執行許多高效能操作。

scikit-learn

scikit-learn是在NumPy和其他一些軟體包的基礎上廣泛使用的Python機器學習庫。它提供了預處理資料，減少維數，實現迴歸，分類，聚類等的方法。

statsmodels

如果要實現線性迴歸並且需要功能超出scikit-learn的範圍，則應考慮使用statsmodels可以用於估算統計模型，執行測試等。

scikit-learn的簡單線性迴歸

1.匯入用到的packages和類

import numpy as np
from sklearn.linear_model import LinearRegression

2.建立資料

x = np.array([5,15,25,35,45,55]).reshape((-1,1))
y = np.array([5,20,14,32,22,38])

現在就生成了兩個陣列:輸入x(迴歸變數)和輸出y(預測變數)，來看看

>>> print(x)
[[ 5]
 [15]
 [25]
 [35]
 [45]
 [55]]
>>> print(y)
[ 5 20 14 32 22 38]

可以看到x是二維的而y是一維的，因為在複雜一點的模型中，係數不只一個。這裡就用到了.reshape()來進行轉換。

3.建立模型

建立一個類的例項LinearRegression，它將代表迴歸模型：

model = LinearRegression()

現在開始擬合模型，首先可以呼叫.fit()函式來得到優的?₀和?₁，具體有下面兩種等價方法

model.fit(x,y)
model = LinearRegression().fit(x,y)

4.檢視結果

擬合模型之後就是檢視與模型相關的各項引數

>>> r_sq = model.score(x,y)
>>> print('coefficient of determination:',r_sq)
coefficient of determination: 0.715875613747954

.score()函式可以獲得模型的?²，再看看係數

>>> print('intercept:',model.intercept_)
intercept: 5.633333333333329
>>> print('slope:',model.coef_)
slope: [0.54]

可以看到係數和截距分別為[0.54]和5.6333，注意係數是一個二維陣列哦。

5.預測效果

一般而言，線性模型最後就是用來預測，我們來看下預測效果

>>> y_pred = model.predict(x)
>>> print('predicted response:',y_pred,sep='\n')
predicted response:
[ 8.33333333 13.73333333 19.13333333 24.53333333 29.93333333 35.33333333]

當然也可以使用下面的方法

>>> y_pred = model.intercept_ + model.coef_ * x
>>> print('predicted response:',sep='\n')
predicted response:
[[ 8.33333333]
 [13.73333333]
 [19.13333333]
 [24.53333333]
 [29.93333333]
 [35.33333333]]

除了可以利用樣本內的資料進行預測，也可以用樣本外的資料進行預測。

>>> x_new = np.arange(5).reshape((-1,1))
>>> print(x_new)
[[0]
 [1]
 [2]
 [3]
 [4]]
>>> y_new = model.predict(x_new)
>>> print(y_new)
[5.63333333 6.17333333 6.71333333 7.25333333 7.79333333]

至此，一個簡單的線性迴歸模型就建立起來了。

scikit-learn的多元線性迴歸

直接開始吧

1.匯入包和類，並建立資料

import numpy as np
from sklearn.linear_model import LinearRegression

x = [[0,1],[5,[15,2],[25,5],[35,11],[45,15],[55,34],[60,35]]
y = [4,5,38,43]
x,y = np.array(x),np.array(y)

看看資料

>>> print(x)
[[ 0 1]
 [ 5 1]
 [15 2]
 [25 5]
 [35 11]
 [45 15]
 [55 34]
 [60 35]]
>>> print(y)
[ 4 5 20 14 32 22 38 43]

2.建立多元迴歸模型

model = LinearRegression().fit(x,y)

3.檢視結果

>>> r_sq = model.score(x,r_sq)
coefficient of determination: 0.8615939258756776
>>> print('intercept:',model.intercept_)
intercept: 5.52257927519819
>>> print('slope:',model.coef_)
slope: [0.44706965 0.25502548]

4.預測

#樣本內
>>> y_pred = model.predict(x)
>>> print('predicted response:',sep='\n')
predicted response:
[ 5.77760476 8.012953  12.73867497 17.9744479 23.97529728 29.4660957
 38.78227633 41.27265006]
#樣本外
>>> x_new = np.arange(10).reshape((-1,2))
>>> print(x_new)
[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]
>>> y_new = model.predict(x_new)
>>> print(y_new)
[ 5.77760476 7.18179502 8.58598528 9.99017554 11.3943658 ]

所有的結果都在結果裡，就不再過多解釋。再看看多項式迴歸如何實現。

多項式迴歸

匯入包和建立資料

import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
x = np.array([5,1))
y = np.array([15,11,2,8,32])

多項式迴歸和之前不一樣的是需要對資料轉換，因為模型裡包含?²等變數，所以在建立資料之後要將x轉換為?²。

transformer = PolynomialFeatures(degree=2,include_bias=False)

再看看資料

>>> print(x_)
[[  5.  25.]
 [ 15. 225.]
 [ 25. 625.]
 [ 35. 1225.]
 [ 45. 2025.]
 [ 55. 3025.]]

建模

接下來的步驟就和之前的類似了。其實多項式迴歸只是多了個數據轉換的步驟，因此從某種意義上，多項式迴歸也算是線性迴歸。

model = LinearRegression().fit(x_,y)

檢視結果

>>> r_sq = model.score(x_,r_sq)
coefficient of determination: 0.8908516262498564
>>> print('intercept:',model.intercept_)
intercept: 21.372321428571425
>>> print('coefficients:',model.coef_)
coefficients: [-1.32357143 0.02839286]

預測

>>> y_pred = model.predict(x_)
>>> print('predicted response:',sep='\n')
predicted response:
[15.46428571 7.90714286 6.02857143 9.82857143 19.30714286 34.46428571]

那麼本次多項式迴歸的所有結果都在上面了，一目瞭然。

以上就是如何在python中實現線性迴歸的詳細內容，更多關於Python實現線性迴歸的資料請關注我們其它相關文章！

如何在python中實現線性迴歸

第二週：python實現線性迴歸（啞變量回歸）的高效方法

我怎麼覺得自己就像小學生在寫青創日記…… 知道了pickle是啥。pickle提供了一個簡單的持久化功能。可以將物件以檔案的形式存放在磁碟上。

一日一技：在 Python 中實現函式過載

假設你有一個函式connect，它有一個引數address，這個引數可能是一個字串，也可能是一個元組。例如：

在SQLite-Python中實現返回、查詢中文欄位的方法

博主在這個問題上卡了挺久的，貼出來解決方法幫助需要的朋友，直接上程式碼（測試環境：win10+Python2.7）：

在Python中實現函式過載的示例程式碼

假設你有一個函式connect，它有一個引數address，這個引數可能是一個字串，也可能是一個元組。例如：

如何在python中實現隨機選擇

這篇文章主要介紹瞭如何在python中實現隨機選擇,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python中實現輸入超時及如何通過變數獲取變數名

背景介紹開發中遇到了一個需求：程式執行到某處時需要使用者確認,但不能一直傻等,後面的程式不能被一直阻塞,需要有個超時限制,也就是這個程式如果在一段時間後還沒有得到使用者輸入就執行預設操作.

在python中實現求輸出1-3+5-7+9-......101的和

第一種： i=0 sum=0 a=0 while i<102: if i>=1 and i%4==1: sum+=i elif i%2!=0 and i!=1: a=a+i i+=1 print(sum-a)

Python中實現輸入一個整數的案例

我就廢話不多說了，大家還是直接看程式碼吧！ #! usr/bin/python3.5 # -*- coding:utf-8 -*-

但是上述介面的params變數無法在Python中實現，只能採用RESTFul形式，傳遞的引數一定要用JSON格式

LiveBos的WSDL模式下有通用的介面 1 execBizProcess(xs:string sessionId, xs:string bizProcessName, xs:string id, lbParameter[] params, lbParameter[] variables, )

原來python中實現語音識別如此簡單！

【導讀】亞馬遜的 Alexa 的巨大成功已經證明：在不遠的將來，實現一定程度上的語音支援將成為日常科技的基本要求。整合了語音識別的 Python 程式提供了其他技術無法比擬的互動性和可訪問性。最重要的是，在 Python

Python中實現一行拆多行和多行並一行的示例程式碼

粉絲提問今天粉絲提了下面這樣一個問題，其中一個是\"一行拆多行\"，另外一個是\"多行並一行\"，貌似群友用power query已經解決了。但是基於Python怎麼做呢？接著往下看。

Python+sklearn使用線性迴歸演算法預測兒童身高

>>> Python+sklearn使用線性迴歸演算法預測兒童身高 In[1]: import copy import numpy as np

協程Python 中實現多工耗資源最小的方式

協程，又稱微執行緒，纖程。英文名 Coroutine。協程是 Python 中另外一種實現多工的方式，只不過比執行緒更小，佔用更小執行單元（理解為需要的資源）。

在Python中實現字典反轉案例

有時候會碰到需求，將字典來反轉，即：字典中的鍵作為值，而字典中的值作為鍵。對於字典比較小，可以使用普通方法

Python中實現字串的反轉

技術標籤：演算法應用字元反轉python 文章目錄原始資料：方法一：使用字串切片方法方法二：使用列表的reverse方法方法三：for迴圈方法四：使用棧方法五：迴圈反向迭代法

python中實現詞雲圖的示例

import matplotlib.pyplot as plt import jieba from wordcloud import wordcloud # 1.讀出詞語 text = open(\'text/test.txt\',\'r\',encoding=\'utf-8\').read()

python中實現棧的三種方法

棧是一種線性資料結構，用先進後出或者是後進先出的方式儲存資料，棧中資料的插入刪除操作都是在棧頂端進行，常見棧的函式操作包括

python中實現列表元素的永久反轉和臨時反轉

>>> test1 = [\"sss\",\"ccc\",\"aaa\",\"ddd\"] >>> test1.reverse()## 就地反轉 >>> test1

python 影象的拉普拉斯變換中的數值問題_從頭開始在python中實現拉普拉斯斑點檢測器...

技術標籤：python 影象的拉普拉斯變換中的數值問題 Harris Corner Detector生成的特徵對於縮放不是不變的。對於特徵跟蹤，我們需要對仿射變換不變的特徵。拉普拉斯斑點檢測器是生成對縮放不變的特徵的基本方法之

如何在python中實現線性迴歸

相關推薦