1、爬虫: nodejs怎么爬ajax的post请求的异步加载的内容?一个页面异步加载新出的内容怎么抓取?一般的get请求: www.xxxx.com/page=xxxget请求可以通过page+1这样加。比如控制页数,抓10页get异步请求比如张大妈的发现http://faxian.smzdm.com/json_more?type=new×ort=1487861419通过前几页,替换计算最后一个数字,实现抓取N页情况2、post方式而post请求,比如知乎的,一个问题下,‘更多’那个button是个post请求https://www.zhihu.com/node/QuestionAnswerListV2post也有url,但是无参数,直接访问可能就404。我尝试过分析 response返回的 json字符,{"r":0, "msg": (里面是新增的div的html代码,没有规律)
}3、请问第2点说的post方式有没有办法抓?
添加回答
举报
0/150
提交
取消