Numpy - Pandas - Matplot 功能與函數名 速查
用Python做數據分析,涉及到的函數實在是太多了,容易忘記,去網上查中文基本上差不到,英文有時候描述不清楚問題。
這裏搞個針對個人習慣的函數匯總速查手冊,下次需要用一個什麽功能,就在這裏面查到對應的函數名字,然後取搜索具體用法。隨時更新。
Numpy
創建:
創建一個隨機數組x*y:
np.empty(x,y)
-----------Pandas----------
Series
判斷是否是唯一的值:
obj.unique()
統計值:
obj.value_counts()
DataFrame:
根據一個列或者多個列進行排序
frame.sort_values(by=[‘a‘,‘b‘])
刪除列/刪除行
del frame[‘a‘]
del frame[3]
對整個表應用操作f
frame.apply(f)
對列進行重新排序/重排:
frame.colomns = [‘b‘,‘c‘,‘a‘]
對每列求和
frame.sum()
對每行求和
frame.sum(axis=1)
求累計和,就是加上前幾行的數據的總和
frame.cumsum()
求每列最大值的索引
frame.idxmax() 返回索引
frame.argmax() 返回一個整數值
求每行最大值的索引
frame.idxmax(axis=1)
對每一列進行匯總統計(包括 計數/均值/方差/最小值/分位點/最大值)
frame.describe()
缺失數據/缺失處理:
刪除缺失數據(NaN):
丟掉數據:dropna
只丟掉全為空的列: data.dropna(axis=1,how=‘all‘)
用指定值填充:fillna
對每個位置判斷有無缺失: isnull , notnull
填充缺失數據(NaN):
用指定值填充:
data.fiina(1)
用平均值填充:
data.fillna(data.mean())
Numpy - Pandas - Matplot 功能與函數名 速查