为了账号安全,请及时绑定邮箱和手机立即绑定

从 df 中查找重复行。

从 df 中查找重复行。

开满天机 2022-09-06 16:40:57
df = Name    Age CityJack    34  SydneyRiti    30  DelhiAadi    16  New YorkRiti    30  DelhiRiti    30  DelhiRiti    30  MumbaiAadi    40  LondonSachin  30  Delhidf[df.duplicated(keep='last')]上面的代码给出了重复的列表。但是我需要的是,如果包含至少1个重复项,那么它应该返回。dfThe df contains duplicate rows
查看完整描述

2 回答

?
富国沪深

TA贡献1790条经验 获得超9个赞

您可以使用 :any


>>> df

     Name  Age     City

0    Jack   34   Sydney

1    Riti   30    Delhi

2    Aadi   16  NewYork

3    Riti   30    Delhi

4    Riti   30    Delhi

5    Riti   30   Mumbai

6    Aadi   40   London

7  Sachin   30    Delhi

>>> df.duplicated().any()

True

>>> 'The df contains duplicates' if df.duplicated().any() else 'no duplicates' 

'The df contains duplicates'


查看完整回答
反对 回复 2022-09-06
?
人到中年有点甜

TA贡献1895条经验 获得超7个赞

duplicated 实际上返回一个 Series,其中包含每行的布尔值。如果该行具有重复项,则返回的序列中的相应行具有“True”值。

因此,您可以执行以下操作:

df.duplicated().any()

如果数据帧中存在任何重复项,它将返回 True。


查看完整回答
反对 回复 2022-09-06
  • 2 回答
  • 0 关注
  • 190 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信