已解决430363个问题，去搜搜看，总会有你想问的

如何在熊猫 df 上使用这个工作正则表达式（re）来删除多余的非数字字符，星号（*）？

首页猿问如何在熊猫 df...

如何在熊猫 df 上使用这个工作正则表达式（re）来删除多余的非数字字符，星号（*）？

Python

红颜莎娜 2021-06-12 14:01:32

通过使用下面的代码，我可以使用re将这样的字符串：更改为这样*12.2的浮点数12.2：import renumeric_const_pattern = '[-+]? (?: (?: \d* \. \d+ ) | (?: \d+ \.? ) )(?: [Ee] [+-]? \d+ ) ?'rx = re.compile(numeric_const_pattern, re.VERBOSE)print('converted string to float number is', float(rx.findall("*12.2")[0]))converted string to float number is 12.2但我有一个熊猫 df，它是：df = pd.DataFrame([[10, '*41', '-0.01', '2'],['*10.5', 54, 34.2, '*-0.076'], [65, -32.01, '*344.32', 0.01], ['*32', '*0', 5, 43]]) 0 1 2 30 10 *41 -0.01 21 *10.5 54 34.2 *-0.0762 65 -32.01 *344.32 0.013 *32 *0 5 43如何将上面的函数应用于此 df 以删除所有星号字符并制作一个完整的 float dtype pandas df 如下所示？ 0 1 2 30 10 41 -0.01 21 10.5 54 34.2 -0.0762 65 -32.01 344.32 0.013 32 0 5 43

查看完整描述

2 回答

慕村9548890

TA贡献1884条经验获得超4个赞

有点冗长，但这里有一个可行的基于非正则表达式的解决方案，使用melt和str.rpartition。

v = df.melt()['value'].astype(str).str.rpartition('*')[2]

df = pd.DataFrame(v.values.astype(float).reshape(df.shape))

0 1 2 3

0 10.00 10.500 65.00 32.0

1 41.00 54.000 -32.01 0.0

2 -0.01 34.200 344.32 5.0

3 2.00 -0.076 0.01 43.0

反对回复 2021-06-16

2 回答
0 关注
246 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

如何在熊猫 df 上使用这个工作正则表达式（re）来删除多余的非数字字符，星号（*）？

如何在熊猫 df 上使用这个工作正则表达式（re）来删除多余的非数字字符，星号（*）？

2 回答

添加回答