1. 程式人生 > >python之pandas分組統計

python之pandas分組統計

Pandas分組統計佔比

資料例如:

美贊臣標籤 2017-11-15       MOB      女性 110548715660

美贊臣標籤 2017-11-15       MOB      男性 104342715471

美贊臣標籤 2017-11-15       PC  女性 398273 887

美贊臣標籤 2017-11-15       PC  男性 4691261055

處理需求:

分組統計性別佔比

處理過程如下:

import pandas as pd

import numpy as np

df=pd.DataFrame({'key1':['美贊臣2017-11-15MOB','美贊臣2017-11-15MOB','美贊臣2017-11-15PC','美贊臣2017-11-15PC'],'key2':['女性','男鞋','女性','男性'],'imp':[1105487,1045427,3911,3922]})

df

group1=df.groupby(['key1','key2'])

group2=df.groupby(['key1'])

a1=group1.sum().reset_index()

b1=group2.sum().reset_index()

p=pd.merge(a1,b1,how='outer',on='key1')

m=p["imp_x"]/p["imp_y"]

p["rate"]=m

p

處理結果如下: