你能支持我如何解决下面这个问题吗?我试图找到一种基于 groupby 的主要类别,看看类别如何具有更高的价值。我有下面的数据框。>> USER PROCESS HOURS_WORKED>> 0 USER1 PROCESS1 1>> 1 USER1 PROCESS2 2>> 2 USER1 PROCESS3 3>> 3 USER2 PROCESS1 1>> 4 USER2 PROCESS2 5>> 5 USER2 PROCESS3 3我根据用户和进程应用 groupby mehotd。dfg = df1.groupby(['USER','PROCESS']).sum()我的目标是下面的数据框。USER MAIN_PROCESSUSER1 PROCESS3USER2 PROCESS2groupby 中是否有任何方法或函数可以做到这一点?先感谢您。
1 回答
侃侃尔雅
TA贡献1801条经验 获得超15个赞
尝试:
df[df.groupby(['USER']).HOURS_WORKED.rank("dense", ascending=False).eq(1)]
结果:
USER PROCESS HOURS_WORKED
2 USER1 PROCESS3 3
4 USER2 PROCESS2 5
当 rank of HOURS_WORKEDdescending order perUSER等于 1 时,表示“主进程”。
添加回答
举报
0/150
提交
取消