为了账号安全,请及时绑定邮箱和手机立即绑定

如何基于其他列在Python中创建排名列

如何基于其他列在Python中创建排名列

慕田峪9158850 2021-10-05 15:41:32
我有一个 python 数据框,如下所示:此数据框已按“transaction_count”降序排序。我想在该数据框中创建另一个名为“rank”的列,其中包含 cust_ID 的出现次数。我的愿望输出如下所示:对于 cust_ID = 1234 且 transaction_count = 4,等级将为 1,对于 cust_ID = 1234 的下一次出现,等级将为 2,依此类推。我尝试了以下方法:df['rank'] = df["cust_ID"].value_counts()df.head(10)但是排名列被创建为所有 NaN 值 任何关于如何解决这个问题的建议将不胜感激!
查看完整描述

2 回答

?
湖上湖

TA贡献2003条经验 获得超2个赞

你可以做:


df['rank'] = df.groupby('cust_ID')['transaction_count'].rank(ascending=False)

输出:


    cust_ID     associate_ID    transaction_count   rank

0   1234           608          4                   1.0

1   1234           785          1                   2.0

2   4789           345          2                   1.0

3   3456           268          5                   1.0

4   3456           725          3                   2.0

5   3456           795          1                   3.0

请注意,这不仅会给出计数,还会基于transaction_count值给出交易的排名。


查看完整回答
反对 回复 2021-10-05
?
LEATH

TA贡献1936条经验 获得超6个赞

使用groupby + cumcount:


df['rank'] = df.groupby('cust_ID').cumcount() + 1

print(df['rank'])

输出


0    1

1    2

2    1

3    1

4    2

5    3

Name: rank, dtype: int64


查看完整回答
反对 回复 2021-10-05
  • 2 回答
  • 0 关注
  • 273 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信