为了账号安全,请及时绑定邮箱和手机立即绑定

Selenium 和 Python,从 HTML 正文中获取没有任何标签的文本

Selenium 和 Python,从 HTML 正文中获取没有任何标签的文本

MYYA 2021-09-23 09:16:05
需要使用 Selenium 和 Python 在标签之间获取句子:       <h2 id='PO-PF2' class="section">Program Information</h2>        Length: Two-year Ontario College Graduate Certificate program        <br />Delivery Sequence:<br />使用 find_element_by_xpath在不同的变化并没有返回任何结果。使用driver.find_element_by_tag_name("body").text然后解析它以获取所需的句子,但还有其他方法吗?预期结果:长度:两年安大略大学研究生证书课程更新:'(?<=Length:)([\s\S]*?)(?=\n)' 涵盖所有需要的案例
查看完整描述

1 回答

?
陪伴而非守候

TA贡献1757条经验 获得超8个赞

您可以在此处使用正则表达式:(?=Length)(.*)(?<=program)

(?=...) 断言可以在此处匹配给定的子模式,而无需消耗字符

(?<=...) 确保给定的模式匹配,在表达式中的当前位置结束。图案必须有固定的宽度。不消耗任何字符


查看完整回答
反对 回复 2021-09-23
  • 1 回答
  • 0 关注
  • 568 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信