1. 程式人生 > 實用技巧 >pandas DataFrame.groupby()所見的各種用法詳解

pandas DataFrame.groupby()所見的各種用法詳解

這篇文章主要介紹了DataFrame.groupby()所見的各種用法詳解,文中通過示例程式碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

groupby的函式定義:

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)

  • by :接收對映、函式、標籤或標籤列表;用於確定聚合的組。
  • axis : 接收 0/1;用於表示沿行(0)或列(1)分割。
  • level : 接收int、級別名稱或序列,預設為None;如果軸是一個多索引(層次化),則按一個或多個特定級別分組。
  • as_index:接收布林值,預設Ture;Ture則返回以組標籤為索引的物件,False則不以組標籤為索引。

其他的引數解釋就看文件吧:連結:pandas.DataFrame.groupby 介紹文件

所見 1 :日常用法

import pandas as pd
 
df = pd.DataFrame({'Gender' : ['', '', '', '', '', '', '', '', ''],
          'name' : ['周杰倫', '蔡依林', '林俊杰', '周杰倫', '林俊杰', '周杰倫', '田馥甄', '蔡依林', '田馥甄'],
          
'income' : [4.5, 2.9, 3.8, 3.7, 4.0, 4.1, 1.9, 4.1, 3.2], 'expenditure' : [1.5, 1.9, 2.8, 1.7, 4.1, 2.5, 1.1, 3.4, 1.2] }) #根據其中一列分組 df_expenditure_mean = df.groupby(['Gender']).mean() #根據其中兩列分組 df_expenditure_mean = df.groupby(['Gender', 'name']).mean() #只對其中一列求均值 df_expenditure_mean = df.groupby(['
Gender', 'name'])['income'].mean()
View Code