为了账号安全,请及时绑定邮箱和手机立即绑定

使用熊猫中的另一列替换一列中的值的有效方法

使用熊猫中的另一列替换一列中的值的有效方法

精慕HU 2021-06-28 12:04:14
如何使用不同列 [2] 中的字符串值列表替换数据框列 [1] 中的字符串值。数据          0                       1            2              30  3000 20%  dummy1 3000 dummy2 20%  [3000, 20%]  dummy1 dummy2我想使用第 2 列中的列表(即“[3000, 20%]”)替换第 1 列中的字符串值,即“dummy1 3000 dummy2 20%”。所以 3000 和 20% 被替换为字符串中的“”(空字符串)以形成第三列(结果)即“dummy1 dummy2”代码df = pd.DataFrame([['3000 20%', 'dummy1 3000 dummy2 20%']])df[2] = df[0].str.split(' ')def replace_string(x):    repl_string = str(x[1])    for key in x[2]:        repl_string = repl_string.replace(key, '')    return ' '.join(repl_string.split())df[3] = df.apply(replace_string, axis=1)我目前已经编写了上面的代码,这对于大型数据帧来说很慢。如何提高此代码的效率或有其他方法可以做到这一点?
查看完整描述

1 回答

?
素胚勾勒不出你

TA贡献1827条经验 获得超9个赞

使用嵌套列表理解:


df = pd.DataFrame([['3000 20%', 'dummy1 a 3000 dummy2 20%'],

                   ['abc 2%', 'klmn 3000 dummy2 2%']])

print (df)

          0                         1

0  3000 20%  dummy1 a 3000 dummy2 20%

1    abc 2%       klmn 3000 dummy2 2%


df[3] = [' '.join(y for y in j.split() if y not in i.split()) for i, j in zip(df[0], df[1])]

print (df)

          0                         1                 3

0  3000 20%  dummy1 a 3000 dummy2 20%   dummy1 a dummy2

1    abc 2%       klmn 3000 dummy2 2%  klmn 3000 dummy2


查看完整回答
反对 回复 2021-07-06
  • 1 回答
  • 0 关注
  • 124 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号