为了账号安全,请及时绑定邮箱和手机立即绑定

计算数据集中的所有唯一值

计算数据集中的所有唯一值

吃鸡游戏 2022-01-11 20:11:15
我有一个包含 60 多台计算机的数据集,每列是计算机,行是从每台 PC 安装的所有软件的集合。我希望能够计算每个唯一值(软件),这样我就可以看到当前安装了每个软件的数量。data = [['a','a','c'],['a','b','d'],['a','c','c']]df = pd.DataFrame(data,columns=['col1','col2','col3'])dfcol1  col2  col3a      a      ca      b      da      c      cI expect the following outputa 4b 1c 3
查看完整描述

1 回答

?
幕布斯7119047

TA贡献1794条经验 获得超8个赞

value_counts 后 melt


df.melt().value.value_counts()

Out[648]: 

a    4

c    3

b    1

d    1

Name: value, dtype: int64

numpy.unique 为了加快


pd.Series(*np.unique(df.values.ravel(),return_counts=True)[::-1])

Out[653]: 

a    4

b    1

c    3

d    1

dtype: int64


查看完整回答
反对 回复 2022-01-11
  • 1 回答
  • 0 关注
  • 131 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信