我有一个 HTML 响应,我需要获取<title>页面上最后一个标签之间的数据,有没有办法可以使用 Python 中的正则表达式或使用 Python 中的其他工具来完成此操作?例如。<title>abc</title><title>def</title>应该返回 def。
2 回答
Smart猫小萌
TA贡献1911条经验 获得超7个赞
您不应该使用正则表达式来解析 HTML,因为大多数情况下效率低下且难以阅读。如果您没有任何其他选择,正则表达式应该是最后的选择。
值得庆幸的是,有很多适用于 Python 的 HTML 解析器,例如BeautifulSoup。
使用 BeautifulSoup 你可以获得最后一个标题标签:
last_title = soup.find_all('title')[-1].text.replace('\n', '')
添加回答
举报
0/150
提交
取消