为了账号安全,请及时绑定邮箱和手机立即绑定

在不同类型的大型数据框中删除重复项的省时方法

在不同类型的大型数据框中删除重复项的省时方法

慕桂英4014372 2023-10-06 16:30:50
假设我有这个数据框:列 1 列 2“一”[1,2,3]“一”[1,2,3]'b' [4,5,6]我想删除重复项(在本例中是前两行)。我如何以一种高效的 Python 方式完成这个任务(我的完整数据框有数百万行和 7 列)
查看完整描述

1 回答

?
慕盖茨4494581

TA贡献1850条经验 获得超11个赞

你可以尝试转换为可散列的东西,然后删除


inplace=True 将覆盖您的数据库


df["col2"] = df["col2"].transform(lambda k: tuple(k))

df.drop_duplicates(inplace=True)


查看完整回答
反对 回复 2023-10-06
?
白衣染霜花

TA贡献1796条经验 获得超10个赞

请参阅此处删除重复信息和示例



查看完整回答
反对 回复 2023-10-06
  • 1 回答
  • 0 关注
  • 101 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信