1. 程式人生 > >Numpy - Pandas - Matplot 功能與函數名 速查

Numpy - Pandas - Matplot 功能與函數名 速查

返回 隨機數組 -- 函數名 基本 隨機數 速查 apply val

用Python做數據分析,涉及到的函數實在是太多了,容易忘記,去網上查中文基本上差不到,英文有時候描述不清楚問題。

這裏搞個針對個人習慣的函數匯總速查手冊,下次需要用一個什麽功能,就在這裏面查到對應的函數名字,然後取搜索具體用法。隨時更新。

Numpy

創建:

創建一個隨機數組x*y:

np.empty(x,y)

-----------Pandas----------

Series

判斷是否是唯一的值:

obj.unique()

統計值:

obj.value_counts()

DataFrame:

根據一個列或者多個列進行排序

frame.sort_values(by=[‘a‘,‘b‘])

刪除列/刪除行

del frame[‘a‘]

del frame[3]

對整個表應用操作f

frame.apply(f)

對列進行重新排序/重排:

frame.colomns = [‘b‘,‘c‘,‘a‘]

對每列求和

frame.sum()

對每行求和

frame.sum(axis=1)

求累計和,就是加上前幾行的數據的總和

frame.cumsum()

求每列最大值的索引

frame.idxmax() 返回索引

frame.argmax() 返回一個整數值

求每行最大值的索引

frame.idxmax(axis=1)

對每一列進行匯總統計(包括 計數/均值/方差/最小值/分位點/最大值)

frame.describe()

缺失數據/缺失處理:

刪除缺失數據(NaN):

丟掉數據:dropna

只丟掉全為空的列: data.dropna(axis=1,how=‘all‘)

用指定值填充:fillna

對每個位置判斷有無缺失: isnull , notnull

填充缺失數據(NaN):

用指定值填充:

data.fiina(1)

用平均值填充:

data.fillna(data.mean())

Numpy - Pandas - Matplot 功能與函數名 速查