假设我有一个数据框:DF1:Class | Age | City | Color A | 20 | Los Angeles | Blue A | 20 | Los Angeles | Blue A | 20 | Los Angeles | Red B | 25 | Phoenix | Yellow我想获得每个重复和唯一值的唯一计数,因此输出如下所示:DF2:Class | Age | City | Color | Count A | 20 | Los Angeles | Blue | 2 A | 20 | Los Angeles | Red | 1 B | 25 | Phoenix | Yellow | 1在这种情况下,ClassA、Age20、City洛杉矶和Color蓝色出现了两次。我试过使用,nunique但我的输出没有将重复的值折叠在一起。df = df.groupby(['Class', 'Age', 'City', 'Color']).nunique()
1 回答
汪汪一只猫
TA贡献1898条经验 获得超8个赞
你可以使用size:
result = df.groupby(['Class', 'Age', 'City', 'Color']).size().reset_index(name='Count')
print(result)
输出
Class Age City Color Count
0 A 20 Los Angeles Blue 2
1 A 20 Los Angeles Red 1
2 B 25 Phoenix Yellow 1
添加回答
举报
0/150
提交
取消