pandas DataFrame.groupby()所見的各種用法詳解

阿新 • • 發佈：2020-11-03

這篇文章主要介紹了DataFrame.groupby()所見的各種用法詳解，文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

groupby的函式定義：

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)

by :接收對映、函式、標籤或標籤列表；用於確定聚合的組。
axis : 接收 0/1；用於表示沿行(0)或列(1)分割。
level : 接收int、級別名稱或序列，預設為None；如果軸是一個多索引(層次化)，則按一個或多個特定級別分組。

as_index：接收布林值，預設Ture；Ture則返回以組標籤為索引的物件，False則不以組標籤為索引。

其他的引數解釋就看文件吧：連結：pandas.DataFrame.groupby 介紹文件

所見 1 ：日常用法

import pandas as pd
 
df = pd.DataFrame({'Gender' : ['男', '女', '男', '男', '男', '男', '女', '女', '女'],
          'name' : ['周杰倫', '蔡依林', '林俊杰', '周杰倫', '林俊杰', '周杰倫', '田馥甄', '蔡依林', '田馥甄'],
           
'income' : [4.5, 2.9, 3.8, 3.7, 4.0, 4.1, 1.9, 4.1, 3.2],
         'expenditure' : [1.5, 1.9, 2.8, 1.7, 4.1, 2.5, 1.1, 3.4, 1.2]
         })
#根據其中一列分組
df_expenditure_mean = df.groupby(['Gender']).mean()
 
#根據其中兩列分組
df_expenditure_mean = df.groupby(['Gender', 'name']).mean()
 
#只對其中一列求均值
df_expenditure_mean = df.groupby([' 
Gender', 'name'])['income'].mean()

View Code

pandas DataFrame.groupby()所見的各種用法詳解

pandas dataframe 中的explode函式用法詳解

在使用 pandas 進行資料分析的過程中，我們常常會遇到將一行資料展開成多行的需求，多麼希望能有一個類似於 hive sql 中的 explode 函式。

DataFrame.groupby()所見的各種用法詳解

groupby的函式定義： DataFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=False,**kwargs)

Pandas中loc和iloc函式用法詳解（原始碼+例項）

loc函式：通過行索引 \"Index\" 中的具體值來取行資料（如取\"Index\"為\"A\"的行）

Pandas教程 | 超好用的Groupby用法詳解

在日常的資料分析中，經常需要將資料根據某個（多個）欄位劃分為不同的群體（group）進行分析，如電商領域將全國的總銷售額根據省份進行劃分，分析各省銷售額的變化情況，社交領域將使用者根據畫像（性別、年齡）進

Python資料分析模組pandas用法詳解

本文例項講述了Python資料分析模組pandas用法。分享給大家供大家參考，具體如下：

pandas中read_csv、rolling、expanding用法詳解

如下所示： import pandas as pd from pandas import DataFrame series = pd.read_csv(\'daily-min-temperatures.csv\',header=0,index_col=0,parse_dates=True,squeeze=True)