我有一个包含 5 列的数据集:0 1 2 3 4A Y N N YB N Y N NC N N N ND Y Y N YE N Y Y YF Y Y N YG Y N N Y我想计算在第 3 列和第 4 列中组合 Y 出现的时间百分比,以及在这两列组合中出现时间 N 的百分比。我知道如何单独使用df['3'].value_counts(normalize=True) * 100但无法弄清楚如何将 3 和 4 结合起来。
3 回答
慕无忌1623718
TA贡献1744条经验 获得超4个赞
使用 melt
df[['3','4']].melt().value.value_counts(normalize=True)
Out[8]:
N 0.571429
Y 0.428571
Name: value, dtype: float64
添加回答
举报
0/150
提交
取消