我有一个带有答案的数据框(互联网颜色调查)。数据框是这样的:我有一个带有答案的数据框(互联网颜色调查)。前五行如下所示:id user r g b colorname0 1 72 100 175 pastel blue1 2 204 177 246 faint violet2 3 182 226 245 baby blue3 4 130 64 234 purple4 5 275 49 234 blue和data['colorname'].nunique()和data.colorname.value_counts() 我可以看到有 181270 个唯一答案及其各自的数量。我想从原始数据框中删除所有不在前 100 名中的答案,但 git 卡在这里。#librariesimport pandas as pdimport numpy as npfrom numpy import arraydata = pd.read_csv('color_survey_answers.csv', delimiter='\t')data.head()data['colorname'].nunique()data.colorname.value_counts()
1 回答

斯蒂芬大帝
TA贡献1827条经验 获得超8个赞
您可以尝试以下操作:
data[data.colorname.isin(data.colorname.value_counts()[:100].index)]
添加回答
举报
0/150
提交
取消