我有一个包含 60 多台计算机的数据集,每列是计算机,行是从每台 PC 安装的所有软件的集合。我希望能够计算每个唯一值(软件),这样我就可以看到当前安装了每个软件的数量。data = [['a','a','c'],['a','b','d'],['a','c','c']]df = pd.DataFrame(data,columns=['col1','col2','col3'])dfcol1 col2 col3a a ca b da c cI expect the following outputa 4b 1c 3
1 回答
幕布斯7119047
TA贡献1794条经验 获得超8个赞
value_counts 后 melt
df.melt().value.value_counts()
Out[648]:
a 4
c 3
b 1
d 1
Name: value, dtype: int64
numpy.unique 为了加快
pd.Series(*np.unique(df.values.ravel(),return_counts=True)[::-1])
Out[653]:
a 4
b 1
c 3
d 1
dtype: int64
添加回答
举报
0/150
提交
取消