为了账号安全,请及时绑定邮箱和手机立即绑定

根据其他 df 列有条件地创建新列

根据其他 df 列有条件地创建新列

慕仙森 2023-08-15 18:43:07
如果 df1 满足 df2 两列中的两个条件,我想在 df1 中创建一个新的布尔列。例如:df1:   ID         Date01234    8-23-202001234    8-26-202001235    8-24-202001235     9-3-202001236     9-1-2020df2:   id       visit01234    8-23-202001235     9-3-2020我想在 df1 中仅将 df2 中的访问设置为“True”,结果如下:df1:   ID         Date    In_store01234    8-23-2020        101234    8-26-2020        001235    8-24-2020        001235     9-3-2020        101236     9-1-2020        0我试过了:pos_id = df2['id'].tolist()pos_date = df2['visit'].tolist()for row in df:    if df1['ID'].isin(pos_id) and df1['Date'].isin(pos_visit):        df1['In_store'] = 1    else:         df1['In_store'] = 0但我得到:“ValueError:系列的真值不明确。使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()。”我已经尝试过:for row in df:    if df1['ID'] == df2['ID'] and df1['Date'] == df2['Date']:        df1['In_store'] = 1    else:         df1['In_store'] = 0但我得到:“ValueError:只能比较相同标签的系列对象”,即使将列重命名为相同的列后也是如此。我缺少什么?谢谢
查看完整描述

1 回答

?
阿波罗的战车

TA贡献1862条经验 获得超6个赞

这本质上是合并:


merged = df1.merge(df2, left_on=['ID','Date'], right_on=['id','visit'], how='left')


df1['In_store'] = merged['visit'].notna().astype(int)

输出:


     ID       Date  In_store

0  1234  8-23-2020         1

1  1234  8-26-2020         0

2  1235  8-24-2020         0

3  1235   9-3-2020         1

4  1236   9-1-2020         0


查看完整回答
反对 回复 2023-08-15
  • 1 回答
  • 0 关注
  • 87 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信