我有数据集 df,其中包含以下数据:starttime endtime ID Diff 1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 101/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 101/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10期望的结果:starttime endtime ID Diff1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 101/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10如果您注意到,A 组中的一行已被删除,因为它是完全重复的:1/10/2020 9:05:00 pm 1/10/2020 9:05:10 A 10这是我正在使用的代码,但是,我不确定括号中包含什么,或者这是否正确:df.drop_duplicates(subset=None, keep=False)任何建议表示赞赏。
2 回答
撒科打诨
TA贡献1934条经验 获得超2个赞
尝试查看文档。如果您无法确定最适合您的情况,请再次询问,并提供上下文(例如示例)。
该链接适用于熊猫 0.25
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html
添加回答
举报
0/150
提交
取消