当您想使用正则表达式从HTML中选择一些文本,而在潜在选择之后发生的事情很重要时,我会想像您必须执行以下操作:selected = re.findall(r'<a (.*?) >About', text)显然这是行不通的,但是正确的方法是什么?
3 回答

胡子哥哥
TA贡献1825条经验 获得超6个赞
似乎喜欢re正确处理前缀和后缀:
a = '<a href="#about">About</a>'
re.findall(r'<a (.*?) >About', a)
[]
re.findall(r'<a (.*?)>About', a)
['href="#about"']
re.findall(r'<a (.*?)>Abo ut', a)
[]
添加回答
举报
0/150
提交
取消