为了账号安全,请及时绑定邮箱和手机立即绑定

计算熊猫组内的重复值和唯一值

计算熊猫组内的重复值和唯一值

哈士奇WWW 2021-10-12 16:45:50
假设我有一个数据框:DF1:Class | Age | City        | Color  A   | 20  | Los Angeles | Blue  A   | 20  | Los Angeles | Blue  A   | 20  | Los Angeles | Red  B   | 25  | Phoenix     | Yellow我想获得每个重复和唯一值的唯一计数,因此输出如下所示:DF2:Class | Age | City        | Color   | Count  A   | 20  | Los Angeles | Blue    |  2  A   | 20  | Los Angeles | Red     |  1  B   | 25  | Phoenix     | Yellow  |  1在这种情况下,ClassA、Age20、City洛杉矶和Color蓝色出现了两次。我试过使用,nunique但我的输出没有将重复的值折叠在一起。df = df.groupby(['Class', 'Age', 'City', 'Color']).nunique()
查看完整描述

1 回答

?
汪汪一只猫

TA贡献1898条经验 获得超8个赞

你可以使用size:


result = df.groupby(['Class', 'Age', 'City', 'Color']).size().reset_index(name='Count')

print(result)

输出


  Class  Age         City   Color  Count

0     A   20  Los Angeles    Blue      2

1     A   20  Los Angeles     Red      1

2     B   25      Phoenix  Yellow      1


查看完整回答
反对 回复 2021-10-12
  • 1 回答
  • 0 关注
  • 129 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信