我有以下数据集df = pd.DataFrame({'A' : ['E1', 'E1', 'E1', 'E2', 'E2'], 'B' : ['R1', 'R1', 'R2', 'R2', 'R2'], 'C' : [100, 100, 300, 250, 250]})我现在想使用A和B作为观察的共享标识符来聚合行。然后我想计算总和和平均值C并计算这对被观察到的次数,并将这些值附加到数据帧中。df = pd.DataFrame({'A' : ['E1', 'E1', 'E2'], 'B' : ['R1', 'R2', 'R2'], 'C_sum' : [200, 300, 500], 'C_avg' : [100, 300, 250], 'count' : [2, 1, 2]})
1 回答
梵蒂冈之花
TA贡献1900条经验 获得超5个赞
使用groupby与agg
df.groupby(['A','B']).C.agg(['sum','mean','count']).reset_index()
A B sum mean count
E1 R1 200 100 2
E2 R2 300 300 1
E2 R2 500 250 2
添加回答
举报
0/150
提交
取消