Python statsmodel包訓練LR模型

阿新 • • 發佈：2018-12-12

Python中訓練LR模型一般使用sklearn包，輸出模型報告和其他機器學習方法一樣。但從統計背景出發，想看更詳細的報告，statsmodel包可以幫助實現。

1.訓練模型

import statsmodels.api as sm
from statsmodels.stats.outliers_influence import variance_inflation_factor

    #train樣本上訓練模型
    y = trainData[y_name]
    X = trainData[model_list]
    X['intercept'] = [1] * X.shape[0]
    
    LR = sm.Logit(y, X).fit()

2.模型報告

	#LR自帶的summary報告，直接輸出到excel不方便
    summary = LR.summary()

    #檢視VIF
    X_m = np.matrix(X)
    VIF_list = [variance_inflation_factor(X_m, i) for i in range(X_m.shape[1])]
    #varname_list = [X.columns[i] for i in range(len(VIF_list))]
    
    #計算標準化係數
    X_new = X.drop(['intercept'],axis = 1)
    X_new2 = X_new.apply(lambda x: (x - np.mean(x)) / np.std(x))
    LR_N = sm.Logit(trainData[y_name], X_new2).fit()

    #wald檢驗
    wald_test = LR.wald_test_terms().table

    #拼接report
    model_rpt1 = pd.concat([LR.params,LR.pvalues,wald_test['statistic'],LR_N.params],sort = False,axis = 1)
    model_rpt1.columns = ['params','pvals','wald','normal_params']
    model_rpt1['VIF'] = VIF_list
    model_rpt1.sort_values(['normal_params'],ascending = True,inplace = True)
    model_rpt1.fillna(0,inplace = True)
    
    #計算模型變數間的相關係數
    corr = X.drop(['intercept'],axis = 1).corr()
    corr2 = corr.reset_index()

3.其他

1.statsmodel訓練模型過程不涉及篩選變數，所有送進去的模型變數都會參與擬合； 2.LR.predict(X_test) 可以給其他樣本打分，其結果是p，而根據係數得到的結果是log(p/1-p)。

Python statsmodel包訓練LR模型

Python中訓練LR模型一般使用sklearn包，輸出模型報告和其他機器學習方法一樣。但從統計背景出發，想看更詳細的報告，statsmodel包可以幫助實現。 1.訓練模型 import statsmodels.api as sm from statsmode

使用spark訓練LR模型

最近在工作之餘參加了一個CTR預估的比賽，CTR預估是一個成熟又經典的問題，工業界目前使用的主流方案仍然是LR+海量特徵。趁著這一次比賽的機會，正好抱著學習的心態嘗試著學習用spark叢集來訓練一下LR。在學校的時候大家訓練模型一般都是用python+pandas+numpy+skle

Python Word2Vec使用訓練好的模型生成詞向量

https 一起失效 com mode 密碼 pytho ID list # 文本文件必須是utf-8無bom格式 from gensim.models.deprecated.word2vec import Word2Vec model = Word2Vec.lo

Tensorflow.js執行Python下訓練的模型

一、引言這兩天的專案需要用到Tensorflow.js來實現一個AI，儘管說Tensorflow.js本身是有訓練模型的功能的，不過考慮到javascript這個東西載入資源要考慮跨域問題等種種因素。。最終還是決定使用python的tensorflow來訓練模型，然後利用js端來使用模型進行運

用這個Python庫，訓練你的模型成為下一個街頭霸王！

作者 | MJ-Murray 譯者 | 孤鴻整理 | Jane 出品 | AI科技大本營從世界矚目的圍棋遊戲 AlphaGo，近年來，強化學習在遊戲領域裡不斷取得十分引人注目的成績。自此之後，棋牌遊戲、射擊遊戲、電子競技遊戲，如 Atari、超級馬

python下進行lda主題挖掘(二)——利用gensim訓練LDA模型

到2018年3月7日為止，本系列三篇文章已寫完，可能後續有新的內容的話會繼續更新。本篇是我的LDA主題挖掘系列的第二篇，介紹如何利用gensim包提供的方法來訓練自己處理好的語料。 gensim提供了多種方法：速度較慢的：

【caffe學習筆記之7】caffe-matlab/python訓練LeNet模型並應用於mnist資料集（2）

【案例介紹】 LeNet網路模型是一個用來識別手寫數字的最經典的卷積神經網路，是Yann LeCun在1998年設計並提出的，是早期卷積神經網路中最有代表性的實驗系統之一，其論文是CNN領域第一篇經典之作。本篇部落格詳細介紹基於Matlab、Python訓練lenet手

XGBOOST + LR 模型融合 python 程式碼

XGBOOST + LR (XGBOOST grid search) 先留個廣告，最近做一個數據挖掘的比賽，主要用的就是 xgboost，等比賽完後年前好好整理程式碼開源，到時候程式碼會比下面整份完整。 XGBOOST + LR 是 CTR 常用的一種方式。

Python機器學習庫sklearn裡利用LR模型進行三分類（多分類）的原理

首先，LR將線性模型利用sigmoid函式進一步做了非線性對映。將分類超平面兩側的正負樣本點，通過壓縮函式轉化成了以0.5為分解的兩類：類別0和類別1。這個轉化過程見下圖：上圖給出的是線性邊界與LR分佈函式（即sigmoid函式）的對映對應關係；同樣，對於非線

linux和windows下安裝python拓展包及requirement.txt安裝類庫

too tor == 引導 -cp mod flask utf addition http://blog.csdn.net/pipisorry/article/details/39902327python拓展包安裝直接安裝拓展包默認路徑：Unix(Linux)默認路徑：/

python 一個包中的文件調用另外一個包文件實例

pat def pre img end import test imp clas python不同文件夾中模塊的引用調用順序，被調用的模塊中①有類的模塊.類().方法() ②無類的：模塊.方法() test包中testIm.py 調用 test1包中testIm1.

python閉包和裝飾器（轉）

lee type ade 機制並且 change -1 pri neu 一、python閉包 1、內嵌函數 >>> def func1(): ... print (‘func1 running...‘) ... def func2(

python加密包

import 第三方運行模塊 key rand 分享 code 加密利用pycrypto包進行AES、DES、MD5等加密原文: http://www.cnblogs.com/darkpig/p/5676076.html 第三方Crypto包提供了較全面的

Python 閉包函數

logs 域名 spa div requests code 作用域閉包 cnblogs 一、定義： 1. 定義在函數內部的函數 2. 包含對外部作用域名字的引用，而不是對全局作用域名字的引用那麽該內部函數就稱為閉包函數 x=1 def f1(): x=1111

python 3 包與模塊

ack lpar syn 文件 shell turn hang insert return 包與模塊一、模塊 1 什麽是模塊？常見的場景：一個模塊就是一個包含了python定義和聲明的文件，文件名就是模塊名字加上.py的後綴。 import加載的模塊分為四個通用類別

python相對包導入報“Attempted relative import in non-package”錯誤

package 相對 swe 部分 nth 位置 .com str 例子在python當中使用相對包導入有的時候是一件非常讓人痛苦的事情，有的時候使用了相對包導入明明可以在運行，但是換了一種運行方式又不可以了。這篇文章就要深度的解決這個問題，在看的過程要不斷的敲代碼來

在windows下面用pip安裝python的包時候提示invalid syntax

syn ges 安裝python 解決 tac 安裝出錯找到然而 ack 剛學python，用pip安裝出錯，如下圖：檢查了一下環境變量，然而並沒沒問題。在stackowerflow上逛了一圈，找到了解決方法：在命令行下cd 進對應python的script文件目

Python--閉包與裝飾器

python 閉包裝飾器閉包的意義：返回的函數對象，不僅僅是一個函數對象，在該函數外還包裹了一層作用域，這使得，該函數無論在何處調用，優先使用自己外層包裹的作用域 #應用領域：延遲計算（原來我們是傳參，現在我們是包起來）from urllib.request import urlopen

python 閉包

python3 style pre 最終變參 ng- con 結果 pan 閉包概念在函數內部再定義一個函數，並且這個函數用到了外邊函數的變量，那麽將這個函數以及用到的一些變量稱之為閉包，最終外部函數返回的結果為內部函數 In [33]: def te(number)

centos6.x安裝yum及python依賴包

whereis bsp evel pytho 安裝包 3.1 1.2 com fast 步驟1：清空pythonrpm -qa|grep python|xargs rpm -e --allmatches --nodeps whereis python|xargs rm -f

Python statsmodel包訓練LR模型

1.訓練模型

2.模型報告

3.其他

相關推薦