2 回答
TA贡献1886条经验 获得超2个赞
使用 duplicated
test[~test.price.duplicated(keep=False)]
price
3 3
4 5
test.index[~test.price.duplicated(keep=False)]
Int64Index([3, 4], dtype='int64')
更新然后你需要 transform
test[test.groupby('price').price.transform('count')<=1]
price
3 3
4 5
test[test.groupby('price').price.transform('count')<3].index
Int64Index([0, 2, 3, 4], dtype='int64')
TA贡献1848条经验 获得超6个赞
您可以计算物品value_counts并选择“足够稀有”的物品:
THRESHOLD = 3
is_rare = test['price'].value_counts() < THRESHOLD
rare = is_rare[is_rare].index
#Int64Index([1, 5, 3], dtype='int64')
接下来,找到包含稀有物品的行:
are_rare_rows = test["price"].isin(rare)
are_rare_rows[are_rare_rows].index
#Int64Index([0, 2, 3, 4], dtype='int64')
添加回答
举报