python中sklearn的pipeline模組例項詳解

阿新 • • 發佈：2020-05-22

最近在看《深度學習：基於Keras的Python實踐（魏貞原）》這本書，書中8.3建立了一個Scikit-Learn的Pipeline，首先標準化資料集，然後建立和評估基線神經網路模型，程式碼如下：

# 資料正態化，改進演算法
steps = []
steps.append(('standardize',StandardScaler()))
steps.append(('mlp',model))
pipeline = Pipeline(steps)
kfold = KFold(n_splits=10,shuffle=True,random_state=seed)
results = cross_val_score(pipeline,x,Y,cv=kfold)
print('Standardize: %.2f (%.2f) MSE' % (results.mean(),results.std()))

而PipeLine是什麼來的呢？

Pipelines and composite estimators（官方文件）

轉換器通常與分類器，迴歸器或其他估計器組合在一起，以構建複合估計器。最常用的工具是Pipeline。Pipeline通常與FeatureUnion結合使用，FeatureUnion將轉換器的輸出連線到一個複合特徵空間中。 TransformedTargetRegressor處理轉換目標（即對數變換y）。相反，Pipelines僅轉換觀察到的資料（X）。

Pipeline可用於將多個估計器連結為一個。這很有用，因為在處理資料時通常會有固定的步驟順序，例如特徵選擇，歸一化和分類。Pipeline在這裡有多種用途：

方便和封裝：只需呼叫一次fit並在資料上進行一次predict即可擬合整個估計器序列。
聯合引數選擇：可以一次對Pipeline中所有估計器的引數進行網格搜尋（grid search ）。
安全性：通過確保使用相同的樣本來訓練轉換器和預測器，Pipeline有助於避免在交叉驗證中將測試資料的統計資訊洩漏到經過訓練的模型中。

Pipeline是使用 （key，value） 對的列表構建的，其中key是包含要提供此步驟名稱的字串，而value是一個估計器物件：

from sklearn.pipeline import Pipeline
from sklearn.svm import SVC
from sklearn.decomposition import PCA
estimators = [('reduce_dim',PCA()),('clf',SVC())]
pipe = Pipeline(estimators)
pipe

output:

在這裡插入圖片描述

函式make_pipeline是構建pipelines的簡寫;它接受不同數量的估計器，並返回一個pipeline。它不需要也不允許命名估計器。而是將其名稱自動設定為其型別的小寫字母：

from sklearn.pipeline import make_pipeline
from sklearn.naive_bayes import MultinomialNB
from sklearn.preprocessing import Binarizer
make_pipeline(Binarizer(),MultinomialNB())

output:

在這裡插入圖片描述

總結

到此這篇關於python中sklearn的pipeline模組的文章就介紹到這了,更多相關python pipeline模組內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

python 中xpath爬蟲例項詳解

案例一：某套圖網站，套圖以封面形式展現在頁面，需要依次點選套圖，點選廣告盤連結，最後到達百度網盤展示頁面。

python中sklearn的pipeline模組例項詳解

pytorch中的transforms模組例項詳解

pytorch中的transforms模組中包含了很多種對影象資料進行變換的函式，這些都是在我們進行影象資料讀入步驟中必不可少的，下面我們講解幾種最常用的函式，詳細的內容還請參考pytorch官方文件（放在文末）。

python orm 框架中sqlalchemy用法例項詳解

本文例項講述了python orm 框架中sqlalchemy用法。分享給大家供大家參考，具體如下：

使用 Python 讀取電子表格中的資料例項詳解

Python 是最流行、功能最強大的程式語言之一。由於它是自由開源的，因此每個人都可以使用。大多數 Fedora 系統都已安裝了該語言。Python 可用於多種任務，其中包括處理逗號分隔值（CSV）資料。CSV檔案一開始往往是以

python圖形使用者介面例項詳解

本文例項為大家分享了python圖形使用者介面例項的具體程式碼，供大家參考，具體內容如下

python裝飾器使用例項詳解

這篇文章主要介紹了python裝飾器使用例項詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python-numpy-指數分佈例項詳解

如下所示： # Seed random number generator np.random.seed(42) # Compute mean no-hitter time: tau tau = np.mean(nohitter_times)

python實發郵件例項詳解

yagmail 實現發郵件 yagmail 可以更簡單的來實現自動發郵件功能。 1、安裝 pip install yagmail

Vuejs中的watch例項詳解(監聽者)

最近剛剛追完慶餘年，心思還總是在劇情裡，然後就覺得在vuejs裡watch就是監察院，一個不折不扣的特務機構。在Vue中watch被稱為監聽者，它隨時觀察這vue例項中每一個數據的變化，當資料發生改變，做出響應。

Python 中@property的用法詳解

在繫結屬性時，如果我們直接把屬性賦值給物件，比如： p = Person() p.name= \'Mary\'

Python操作MySQL資料庫例項詳解【安裝、連線、增刪改查等】

本文例項講述了Python操作MySQL資料庫。分享給大家供大家參考，具體如下： 1、安裝

Python : turtle色彩控制例項詳解

turtle.pencolor（* args ）返回或設定pencolor。允許四種輸入格式： pencolor() 將當前的pencolor返回為顏色規範字符串或元組（參見示例）。可用作另一種顏色/ pencolor / fillcolor呼叫的輸入。

python with (as)語句例項詳解

這篇文章主要介紹了python with (as)語句例項詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python中itertools的用法詳解

iterator 迴圈器(iterator)是物件的容器，包含有多個物件。通過呼叫迴圈器的next()方法 (next()方法，在Python 3.x中)，迴圈器將依次返回一個物件。直到所有的物件遍歷窮盡，迴圈器將舉出StopIteration錯誤。

python scatter函式用法例項詳解

這篇文章主要介紹了python scatter函式用法例項詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python中的 zip函式詳解及用法舉例

python中zip()函式用法舉例定義：zip([iterable,...]) 　　zip()是Python的一個內建函式，它接受一系列可迭代的物件作為引數，將物件中對應的元素打包成一個個tuple（元組），然後返回由這些tuples組成的list（列表

利用Python計算KS的例項詳解

在金融領域中，我們的y值和預測得到的違約概率剛好是兩個分佈未知的兩個分佈。好的信用風控模型一般從準確性、穩定性和可解釋性來評估模型。

Node.js Domain 模組例項詳解

Node.jsDomain(域) 簡化非同步程式碼的異常處理，可以捕捉處理try catch無法捕捉的異常。

C++11智慧指標中的 unique_ptr例項詳解

在前面一篇文章中，我們瞭解了 C++11 中引入的智慧指標之一 shared_ptr 和 weak_ptr ，今天，我們來介紹一下另一種智慧指標 unique_ptr 。

python中sklearn的pipeline模組例項詳解

相關推薦