为了账号安全,请及时绑定邮箱和手机立即绑定

带有答案的数据框,如何仅保留前 100 个答案

带有答案的数据框,如何仅保留前 100 个答案

Qyouu 2021-11-09 19:56:19
我有一个带有答案的数据框(互联网颜色调查)。数据框是这样的:我有一个带有答案的数据框(互联网颜色调查)。前五行如下所示:id  user r   g   b   colorname0   1    72  100 175 pastel blue1   2    204 177 246 faint violet2   3    182 226 245 baby blue3   4    130 64  234 purple4   5    275 49  234 blue和data['colorname'].nunique()和data.colorname.value_counts() 我可以看到有 181270 个唯一答案及其各自的数量。我想从原始数据框中删除所有不在前 100 名中的答案,但 git 卡在这里。#librariesimport pandas as pdimport numpy as npfrom numpy import arraydata = pd.read_csv('color_survey_answers.csv',  delimiter='\t')data.head()data['colorname'].nunique()data.colorname.value_counts()
查看完整描述

1 回答

?
斯蒂芬大帝

TA贡献1827条经验 获得超8个赞

您可以尝试以下操作:

data[data.colorname.isin(data.colorname.value_counts()[:100].index)]


查看完整回答
反对 回复 2021-11-09
  • 1 回答
  • 0 关注
  • 148 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信