为了账号安全,请及时绑定邮箱和手机立即绑定

如何在不删除 NaN 值的情况下删除 pandas 中的重复项

如何在不删除 NaN 值的情况下删除 pandas 中的重复项

弑天下 2023-05-23 10:16:10
我有一个要查询的数据框,我只想从特定列中获取唯一值。我试图执行此代码:    database = pd.read_csv(db_file, sep='\t')     query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])db_specification只是一个包含我查询的两列的列表。有些值是NaN,我不想将它们视为彼此重复,我该如何实现?
查看完整描述

1 回答

?
噜噜哒

TA贡献1784条经验 获得超7个赞

您可以先选择全部NaN,然后将副本放在数据框的其余部分。

mask = data.isna().any()
data = pd.concat([data[mask], data[~mask]])


查看完整回答
反对 回复 2023-05-23
  • 1 回答
  • 0 关注
  • 131 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信