我有一个要查询的数据框,我只想从特定列中获取唯一值。我试图执行此代码: database = pd.read_csv(db_file, sep='\t')
query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])db_specification只是一个包含我查询的两列的列表。有些值是NaN,我不想将它们视为彼此重复,我该如何实现?
1 回答
噜噜哒
TA贡献1784条经验 获得超7个赞
您可以先选择全部NaN
,然后将副本放在数据框的其余部分。
mask = data.isna().any() data = pd.concat([data[mask], data[~mask]])
添加回答
举报
0/150
提交
取消