为了账号安全,请及时绑定邮箱和手机立即绑定

怎样抓取网页内存里的内容

怎样抓取网页内存里的内容

扬帆大鱼 2018-11-06 06:03:10
最近在研究网络爬虫  但抓回来的都是查看原文件一样的值,如果而通过js 已改变的值没办法抓回来,但内存里应该变了,请高手指点怎样抓回来的数据跟显示的一样啊?
查看完整描述

2 回答

?
沧海一幻觉

TA贡献1824条经验 获得超5个赞

js抓取不了

 

一般好的抓取的流程是这样的

确定目标

确定页面

抓取内容(页面上的可见数据,一般是没办法用的)

处理内容(将页面上的可见数据转换为自己需要的数据)

将处理过后的内容存入自己的数据库

虽然你无法抓取他的js

但是可以吧他的js的参数抓取过来

然后在在你的程序里吧那些参数像js处理一遍

然后就获得了你自己想要的的东西了:)


查看完整回答
反对 回复 2018-11-07
?
跃然一笑

TA贡献1826条经验 获得超6个赞

刚在CSDN上看到你这同样的问题。

没有那么简单的就能抓取的,需要分析JS代码,配合自己的判断,总之ELT的过程肯定要自己一行一行去写的。


查看完整回答
反对 回复 2018-11-07
  • 2 回答
  • 0 关注
  • 657 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信