为了账号安全,请及时绑定邮箱和手机立即绑定

pandas多条件分组排序问题 row_number

pandas多条件分组排序问题 row_number

哔哔one 2019-02-17 04:19:36
df = pd.DataFrame({'key1' : ['a','a','a','b','b'], 'key2' : ['c','d','c','c','d'], 'data' : [1,10,2,3,30]}) >>> df key1 key2 data 0 a c 1 1 a d 10 2 a c 2 3 b c 3 4 b d 30 目标结果 key1 key2 data row_number 0 a c 1 1 1 a d 10 1 2 a c 2 2 3 b c 3 1 4 b d 30 1 以key1、key2分组,按照data排序,取出序号应该怎么处理呢?搜索找到的以下方法没有成功 df['row_number'] = df['data'].groupby(df['key1','key2']).rank(ascending=True,method='first')
查看完整描述

1 回答

?
德玛西亚99

TA贡献1770条经验 获得超3个赞

def cumsum_seq(v):
    sub = v.sort_values('data')
    sub['seq'] = sub['seq'].cumsum()
    return sub.loc[:, ['data', 'seq']]

df['seq'] = 1
df.groupby(['key1', 'key2']).apply(cumsum_seq).reset_index().drop(columns='level_2')

结果

key1 key2 data seq
0 a c 1 1
1 a c 2 2
2 a d 10 1
3 b c 3 1
4 b d 30 1
查看完整回答
反对 回复 2019-03-01
  • 1 回答
  • 0 关注
  • 454 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信