假设我有这个数据框:列 1 列 2“一”[1,2,3]“一”[1,2,3]'b' [4,5,6]我想删除重复项(在本例中是前两行)。我如何以一种高效的 Python 方式完成这个任务(我的完整数据框有数百万行和 7 列)
1 回答
慕盖茨4494581
TA贡献1850条经验 获得超11个赞
你可以尝试转换为可散列的东西,然后删除
inplace=True 将覆盖您的数据库
df["col2"] = df["col2"].transform(lambda k: tuple(k))
df.drop_duplicates(inplace=True)
添加回答
举报
0/150
提交
取消