8-Pandas擴充套件之Pandas提升效能的方法（eval()、query()）

阿新 • • 發佈：2020-08-23

　　使用Pandas得到阿布分佈功能進行運算是，經常需要建立臨時物件，這樣會佔用很大的記憶體和使用較長的計算時間。pandas為了解決效能問題，引入了eval()和query()函式，他們都依賴Numexpr包，運算過程中不需要費力地配置中間陣列。

一、使用Pandas.eval()實現高效能運算

1、pandas中的函式eval()能夠將字串物件轉化為有效的表示式，進行求值運算並返回結果；

　　一般地，運算簡單或DataFrame資料量較少之時不適用eval()函式，在DataFrame大於10000行時使用eval(),效能會得到明顯提升。

>>>import numpy as np
>>>import pandas as pd
>>>nrows=20000
>>>nclos=200
>>>df1,df2,df3,df4 = [pd.DataFrame(np.random.randn(nrows,nclos)) for i in range(4)]
>>>%timeit df1+df2+df3+df4
50.8 ms ± 3.11 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

>>>%timeit pd.eval('df1+df2+df3+df4')
23.6 ms ± 888 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

　　其中：魔術命令%timeit可自動多次執行語句，產生一個較為精準的平均執行時間。

　　使用np.allclose()比較兩個陣列是否完全相同，結果為True表示eval函式計算結果與普通Pandas計算結果一致。

>>>np.allclose(df1+df2+df3+df4,pd.eval('df1+df2+df3+df4'))
True

2、eval()支援的運算方式

　　eval()函式支援多種運算方式，如：算數運算、比較運算和布林運算，同時也支援物件屬性與索引的表達方式；

　　eval()函式目前還不支援函式條用，if條件語句，迴圈語句及更為複雜的運算。

3、DataFrame.eval()實現列間運算

>>>df.eval("sex=='female'and score_math>80")
0    False
1     True
2     True
3    False
4     True
5    False
6    False
7    False
8    False
dtype: bool

#新增列
>>> df.eval('sum_score = score_math + score_music',inplace=True)
>>> df
  class     sex  score_math  score_music  sum_score
0     A    male          95           79        174
1     A  female          96           90        186
2     B  female          85           85        170
3     C    male          93           92        185
4     B  female          84           90        174
5     B    male          88           70        158
6     C    male          59           89        148
7     A    male          88           86        174
8     B    male          89           74        163

#修改列
>>> df.eval('score_math = score_math +5')
  class     sex  score_math  score_music  sum_score
0     A    male         100           79        174
1     A  female         101           90        186
2     B  female          90           85        170
3     C    male          98           92        185
4     B  female          89           90        174
5     B    male          93           70        158
6     C    male          64           89        148
7     A    male          93           86        174
8     B    male          94           74        163

4、DataFrame.eval()使用區域性變數

　通過@符號使用Python的區域性變數，@符號表示其後緊隨的是一個變數名稱而不是列名稱，如下：

>>> add = pd.Series([1,2,3,4,5,6,7,8])
>>> df.eval('score_math+@add')
0    96.0
1    98.0
2    88.0
3    97.0
4    89.0
5    94.0
6    66.0
7    96.0
8     NaN
dtype: float64

二、DataFrame.query()方法

　　query()可以實現查詢過濾的功能，其用於與DataFrame.eval()類似。

>>> df.query("score_math>85 & score_music>85")
  class     sex  score_math  score_music  sum_score
1     A  female          96           90        186
3     C    male          93           92        185
7     A    male          88           86        174

　　注意：DtaFrame.eval()盡心相同運算時返回的是布林值

8-Pandas擴充套件之Pandas提升效能的方法（eval()、query()）

　　使用Pandas得到阿布分佈功能進行運算是，經常需要建立臨時物件，這樣會佔用很大的記憶體和使用較長的計算時間。pandas為了解決效能問題，引入了eval()和query()函式，他們都依賴Numexpr包，運算過程中不需要費力

Java面向物件02——回顧方法（定義、呼叫）及加深

方法的定義 package oop.demon01;//Demon01 類public class Demon01 {//main 方法public static void main(String[] args) {}/*修飾符返回型別方法名（。。。。）{//方法體return 返回值;}如果返回值是 void ---

爬蟲與Python：（四）爬蟲進階擴充套件之Pandas——1.什麼是Pandas

什麼是Pandas Pandas 是 Python 語言的一個擴充套件程式庫，用於資料分析。 Pandas 是一個開放原始碼、BSD 許可的庫，提供高效能、易於使用的資料結構和資料分析工具。

爬蟲與Python：（四）爬蟲進階擴充套件之Pandas——3.資料結構Series

1. 定義 Pandas Series 類似表格中的一個列（column），類似於一維陣列，可以儲存任何資料型別。

爬蟲與Python：（四）爬蟲進階擴充套件之Pandas——4.資料結構DataFrame

1. 定義 DataFrame 是一個表格型的資料結構，它含有一組有序的列，每列可以是不同的值型別（數值、字串、布林型值）。DataFrame 既有行索引也有列索引，它可以被看做由 Series 組成的字典（共同用一個索引）。

爬蟲與Python：（四）爬蟲進階擴充套件之Pandas——5.CSV檔案

1. 定義 CSV（Comma-Separated Values，逗號分隔值，有時也稱為字元分隔值，因為分隔字元也可以不是逗號），其檔案以純文字形式儲存表格資料（數字和文字）。

爬蟲與Python：（四）爬蟲進階擴充套件之Pandas——6.JSON化

JSON（JavaScript Object Notation，JavaScript 物件表示法），是儲存和交換文字資訊的語法，類似 XML。

爬蟲與Python：（四）爬蟲進階擴充套件之Pandas——7.資料清洗

說明資料清洗是對一些沒有用的資料進行處理的過程。很多資料集存在資料缺失、資料格式錯誤、錯誤資料或重複資料的情況，如果要對使資料分析更加準確，就需要對這些沒有用的資料進行處理。

Pandas時間序列重取樣(resample)方法中closed、label的作用詳解

Pandas提供了便捷的方式對時間序列進行重取樣，根據時間粒度的變大或者變小分為降取樣和升取樣：

Thinkphp 框架擴充套件之資料庫驅動常用方法小結

本文例項講述了Thinkphp 框架擴充套件之資料庫驅動常用方法。分享給大家供大家參考，具體如下：

Thinkphp 框架擴充套件之應用模式實現方法分析

本文例項講述了Thinkphp 框架擴充套件之應用模式實現方法。分享給大家供大家參考，具體如下：

JVM07_棧幀之動態連結，方法的呼叫、動態語言型別和靜態語言

對於幀幀中的其他三部分：方法返回地址、動態連結和一些附加資訊，可以統稱為幀資料區

mybatisplus擴充套件BaseMapper的方法（InsertBatchSomeColumn及AlwaysUpdateSomeColumnById）

//* <li> 例1: t -> !t.isLogicDelete() , 表示不要邏輯刪除欄位 </li>//* <li> 例2: t -> !t.getProperty().equals(\"version\") , 表示不要欄位名為 version 的欄位 </li>//* <l

pandas：使用函式批量處理資料（map、apply、applymap）

此文轉載自：https://blog.csdn.net/weixin_43887421/article/details/109776020#commentBox pandas：使用函式批量處理資料（map、apply、applymap）

pandas-DataFrame增加行和列資料、刪除行和列資料（append、drop）

技術標籤：pandasPython基礎知識pandasDataFrameappenddrop 程式碼示例： import pandas as pd

效能環境之docker操作指南2（全網最全）

docker [OPTIONS] command Usage: docker [OPTIONS] COMMAND [arg...] docker daemon [ --help | ... ] docker [ -h | --help | -v | --version ]

效能環境之docker操作指南3（全網最全）

docker run Usage: docker run [OPTIONS] IMAGE [COMMAND][ARG...] -a -a,--attach=[]Attach to STDIN, STDOUT or STDERR

多測師肖老師_linux之yum源解決方法（2.3）

yum修改為阿里映象源第一步：修改yum映象配置檔案：sed -i \"s|enabled=1|enabled=0|g\" /etc/yum/pluginconf.d/fastestmirror.conf第二步：將系統自帶的repo檔案改名mv /etc/yum.repos.d/CentOS-Base.repo /etc/y

Python中pandas透視表pivot_table功能詳解（非常簡單易懂）

一、概述 1.1 什麼是透視表？透視表是一種可以對資料動態排布並且分類彙總的表格格式。或許大多數人都在Excel使用過資料透視表，也體會到它的強大功能，而在pandas中它被稱作pivot_table。

《艾爾登法環攻略》怪談志：寄生前夜！癲火之王的養成方法（下）

畫師@00oSamio00《艾爾登法環》怪談志：病村之謎！癲火之王的養成方法（上）

8-Pandas擴充套件之Pandas提升效能的方法（eval()、query()）

一、使用Pandas.eval()實現高效能運算

1、pandas中的函式eval()能夠將字串物件轉化為有效的表示式，進行求值運算並返回結果；

2、eval()支援的運算方式

3、DataFrame.eval()實現列間運算

4、DataFrame.eval()使用區域性變數

二、DataFrame.query()方法

相關推薦