为了账号安全,请及时绑定邮箱和手机立即绑定

python爬虫页面数据和网页源代码数据不一致?

python爬虫页面数据和网页源代码数据不一致?

慕田峪9158850 2018-10-05 18:11:53
网页链接是 http://yanbao.stock.hexun.com...要爬取的是投票的比例,f12和页面的数据是一致的,但是网页源代码和用requests的数据:为什么两者不同,具体的应该怎么解决,页面的数字应该是实时的,这种情况应该如何抓取投票比例的数据呢?求问
查看完整描述

2 回答

?
阿晨1998

TA贡献2037条经验 获得超6个赞

因为页面有些DOM是在js执行之后渲染出来的,你要在右键-页面源码这里看,才是浏览器拿到的页面源码。

如果你要爬取的数据是js渲染得到的,那么有两种办法。一种是直接调用浏览器帮你执行js,拿到你希望拿到的数据。这个可以用selenium这个工具实现。

另一种是你自己模拟js的执行过程,用python代码实现这段算法,拿到数据


查看完整回答
反对 回复 2018-10-14
  • 2 回答
  • 0 关注
  • 4724 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信