为了账号安全,请及时绑定邮箱和手机立即绑定

根据特定列的条件将两个数据帧相乘的有效方法

根据特定列的条件将两个数据帧相乘的有效方法

九州编程 2024-01-15 21:18:21
我想根据条件以有效的方式将两个数据帧 df1 和 df2 相乘。df1:df1 = pd.DataFrame(columns=['user_id', 'gender', 'value_1', 'value_2', 'value_3'], data = [[112,0,50,60,70], [73,10,20,40,55],[61, 0, 15, 30, 45]])    user_id   gender   value_1   value_2   value_30   112       0         50         60        701   73        10        20         40        552   61        0         15         30        45df2:df2 = pd.DataFrame(columns=['gender', 'value_1', 'value_2', 'value_3'], data = [[2, 3, 5, 0], [4, 6, 7, 10]])          value_1    value_2    value_3    gender0         2          3          5          01         4          6          7          10我想将 df1 的 value_1、value_2、value_3 列乘以 df2,其中性别列在两个数据帧中都匹配。我已经按照以下方式完成了此操作并且效果很好:val_cols = ['value_1', 'value_2', 'value_3']df1.loc[df1.gender==0, val_cols] *= df2[df2.gender==0][val_cols].values[0].tolist()df1.loc[df1.gender==10, val_cols] *= df2[df2.gender==10][val_cols].values[0].tolist()但这仅适用于性别列只有几个值的情况,在这种情况下它只能是 0 和 10。但是如果性别有更多不同的值怎么办? 如果 df2 中的性别值和相应的记录数量较高,是否有更好的方法来做到这一点? PS:我的真实数据帧非常大,因此我无法使用 apply 或 map 函数。
查看完整描述

1 回答

?
料青山看我应如是

TA贡献1772条经验 获得超8个赞

您可以.set_index()在gender两个数据帧上然后执行以下操作df.mul():


df1 = pd.DataFrame(columns=['user_id', 'gender', 'value_1', 'value_2', 'value_3'], data = [[112,0,50,60,70], [73,10,20,40,55],[61, 0, 15, 30, 45]])

df2 = pd.DataFrame(columns=['value_1', 'value_2', 'value_3', 'gender'], data = [[2, 3, 5, 0], [4, 6, 7, 10]])


df1 = df1.set_index(['gender', 'user_id'])

df2 = df2.set_index('gender')


out = df1.mul(df2, level=0)

print(out)

印刷:


                value_1  value_2  value_3

gender user_id                           

0      112          100      180      350

10     73            80      240      385

0      61            30       90      225


查看完整回答
反对 回复 2024-01-15
  • 1 回答
  • 0 关注
  • 98 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信