df = Name Age CityJack 34 SydneyRiti 30 DelhiAadi 16 New YorkRiti 30 DelhiRiti 30 DelhiRiti 30 MumbaiAadi 40 LondonSachin 30 Delhidf[df.duplicated(keep='last')]上面的代码给出了重复的列表。但是我需要的是,如果包含至少1个重复项,那么它应该返回。dfThe df contains duplicate rows
2 回答
富国沪深
TA贡献1790条经验 获得超9个赞
您可以使用 :any
>>> df
Name Age City
0 Jack 34 Sydney
1 Riti 30 Delhi
2 Aadi 16 NewYork
3 Riti 30 Delhi
4 Riti 30 Delhi
5 Riti 30 Mumbai
6 Aadi 40 London
7 Sachin 30 Delhi
>>> df.duplicated().any()
True
>>> 'The df contains duplicates' if df.duplicated().any() else 'no duplicates'
'The df contains duplicates'
人到中年有点甜
TA贡献1895条经验 获得超7个赞
duplicated 实际上返回一个 Series,其中包含每行的布尔值。如果该行具有重复项,则返回的序列中的相应行具有“True”值。
因此,您可以执行以下操作:
df.duplicated().any()
如果数据帧中存在任何重复项,它将返回 True。
添加回答
举报
0/150
提交
取消