为了账号安全,请及时绑定邮箱和手机立即绑定

re.sub(".*", ", "(replacement)", "text")

re.sub(".*", ", "(replacement)", "text")

胡子哥哥 2021-11-09 20:37:26
在 Python 3.7(在 Windows 64 位上测试)上,使用 RegEx 替换字符串.*会使输入字符串重复两次!在 Python 3.7.2 上:>>> import re>>> re.sub(".*", "(replacement)", "sample text")'(replacement)(replacement)'在 Python 3.6.4 上:>>> import re>>> re.sub(".*", "(replacement)", "sample text")'(replacement)'在 Python 2.7.5(32 位)上:>>> import re>>> re.sub(".*", "(replacement)", "sample text")'(replacement)'怎么了?如何解决?
查看完整描述

1 回答

?
翻翻过去那场雪

TA贡献2065条经验 获得超14个赞

这不是错误,而是来自提交fbb490fd2f38bd817d99c20c05121ad0168a38ee 的Python 3.7 中的错误修复。


在正则表达式中,非零宽度匹配将指针位置移动到匹配的末尾,以便下一个断言,无论是否为零宽度,都可以从匹配之后的位置继续匹配。因此,在您的示例中,在.*贪婪地匹配并消耗整个字符串之后,指针然后移动到字符串末尾的事实实际上仍然为该位置的零宽度匹配留下了“空间”,这可以从以下代码在 Python 2.7、3.6 和 3.7 中的行为相同:


>>> re.findall(".*", 'sample text')

['sample text', '']

因此,关于在非零宽度匹配之后立即替换零宽度匹配的错误修复现在正确地用替换文本替换了两个匹配。


查看完整回答
反对 回复 2021-11-09
  • 1 回答
  • 0 关注
  • 167 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信