为了账号安全,请及时绑定邮箱和手机立即绑定

计算数据帧的两个单独列中的值不相等的次数百分比

计算数据帧的两个单独列中的值不相等的次数百分比

万千封印 2021-09-11 16:00:12
我有一个包含 5 列的数据集:0   1   2   3   4A   Y   N   N   YB   N   Y   N   NC   N   N   N   ND   Y   Y   N   YE   N   Y   Y   YF   Y   Y   N   YG   Y   N   N   Y我想计算在第 3 列和第 4 列中组合 Y 出现的时间百分比,以及在这两列组合中出现时间 N 的百分比。我知道如何单独使用df['3'].value_counts(normalize=True) * 100但无法弄清楚如何将 3 和 4 结合起来。
查看完整描述

3 回答

?
慕无忌1623718

TA贡献1744条经验 获得超4个赞

使用 melt


df[['3','4']].melt().value.value_counts(normalize=True)

Out[8]: 

N    0.571429

Y    0.428571

Name: value, dtype: float64


查看完整回答
反对 回复 2021-09-11
  • 3 回答
  • 0 关注
  • 103 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信