为了账号安全,请及时绑定邮箱和手机立即绑定

无需正则表达式的Python处理HTTP链接标头

无需正则表达式的Python处理HTTP链接标头

繁花不似锦 2021-03-30 16:00:54
某些HTTP响应可以具有链接标头,例如<http://www.i_am_a_url.com>;rel="meta data"。有谁知道任何干净的方法来获取URL?如果可能,我宁愿不使用正则表达式,因为正则表达式会使代码难以读懂。
查看完整描述

1 回答

?
紫衣仙女

TA贡献1839条经验 获得超15个赞

使用lxml


impoprt lxml.html


root = lxml.html.fromstring(response_content_string)

for a in root.cssselect('a[href]'):

    print(a)

或者


impoprt lxml.html


root = lxml.html.fromstring(response_content_string)

for el, attr, url, _ in root.iterlinks():

    print(url)


查看完整回答
反对 回复 2021-04-01
  • 1 回答
  • 0 关注
  • 135 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号