为了账号安全,请及时绑定邮箱和手机立即绑定

如何从布尔值的 Pandas DataFrame 创建频率分布矩阵

如何从布尔值的 Pandas DataFrame 创建频率分布矩阵

函数式编程 2023-02-22 10:56:29
简而言之,我正在尝试翻译这样的 DataFramePatient   Cough   Headache   Dizzy   1        1         0        0    2        1         1        1   3        0         1        0    4        1         0        1   5        0         1        0 成类似于 Pandas 相关特征的频率分布矩阵。也就是说,它会返回这样的东西        Cough   Headache   DizzyCough     1       0.33     0.66Headache 0.33       1      0.33Dizzy     1       0.5       1因为每 3 个头痛的人中就有 1 个是头晕的,但是头晕的人中只有二分之一有头痛,等等。我想要使用它的实际数据要大得多,所以我很好奇 Pandas 是否有办法自动执行此操作。
查看完整描述

1 回答

?
噜噜哒

TA贡献1784条经验 获得超7个赞

是这样的吗?


# extract columns of interest

s = df.iloc[:,1:]


# output

((s.T @ s)/s.sum()).T

输出:


             Cough  Headache     Dizzy

Cough     1.000000  0.333333  0.666667

Headache  0.333333  1.000000  0.333333

Dizzy     1.000000  0.500000  1.000000


查看完整回答
反对 回复 2023-02-22
  • 1 回答
  • 0 关注
  • 52 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信