为了账号安全,请及时绑定邮箱和手机立即绑定

爬虫 遇到了特殊情况

爬虫 遇到了特殊情况

Helenr 2018-11-16 20:15:37
https://www.lagou.com/gongsi/... 网址我要提取这个标签下面的内容<div class="item_manager_content"但是第一个没有p 其他都有p 遇到这种情况如何处理?
查看完整描述

1 回答

?
皈依舞

TA贡献1851条经验 获得超3个赞

这种不完整的网页确实很坑,建议使用beautifulsoup的html5lib库来解析,它的容错性最好了,就是速度较慢

查看完整回答
反对 回复 2018-11-16
  • 1 回答
  • 0 关注
  • 603 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信