为了账号安全,请及时绑定邮箱和手机立即绑定

CrawlSpider 爬取拉勾网重定向302问题解决方案

CrawlSpider 爬取拉勾网重定向302问题解决方案

等不到的年华 2017-10-15 21:05:50
custom_settings = {    "COOKIES_ENABLED": False,    "DOWNLOAD_DELAY": 1,    'DEFAULT_REQUEST_HEADERS': {        'Accept': 'application/json, text/javascript, */*; q=0.01',        'Accept-Encoding': 'gzip, deflate, br',        'Accept-Language': 'zh-CN,zh;q=0.8',        'Connection': 'keep-alive',        'Cookie': 'user_trace_token=20171015132411-12af3b52-3a51-466f-bfae-a98fc96b4f90; LGUID=20171015132412-13eaf40f-b169-11e7-960b-525400f775ce; SEARCH_ID=070e82cdbbc04cc8b97710c2c0159ce1; ab_test_random_num=0; X_HTTP_TOKEN=d1cf855aacf760c3965ee017e0d3eb96; showExpriedIndex=1; showExpriedCompanyHome=1; showExpriedMyPublish=1; hasDeliver=0; PRE_UTM=; PRE_HOST=www.baidu.com; PRE_SITE=https%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DsXIrWUxpNGLE2g_bKzlUCXPTRJMHxfCs6L20RqgCpUq%26wd%3D%26eqid%3Dee53adaf00026e940000000559e354cc; PRE_LAND=https%3A%2F%2Fwww.lagou.com%2F; index_location_city=%E5%85%A8%E5%9B%BD; TG-TRACK-CODE=index_hotjob; login=false; unick=""; _putrc=""; JSESSIONID=ABAAABAAAFCAAEG50060B788C4EED616EB9D1BF30380575; _gat=1; _ga=GA1.2.471681568.1508045060; LGSID=20171015203008-94e1afa5-b1a4-11e7-9788-525400f775ce; LGRID=20171015204552-c792b887-b1a6-11e7-9788-525400f775ce',        'Host': 'www.lagou.com',        'Origin': 'https://www.lagou.com',        'Referer': 'https://www.lagou.com/',        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',    }}
查看完整描述

3 回答

?
红糖麻花

TA贡献2条经验 获得超0个赞

这个应该是在爬虫配置里添加了请求头信息,就跟浏览器的那个调试界面里的Request Headers一样。拉钩好像不用登陆也可以浏览,所以把那行cookie注释掉也可以。亲测有效,不过还是有一部分仍然会302.

查看完整回答
反对 回复 2018-03-10
  • Mr1011
    Mr1011
    请教一下大神,怎么在setting加头信息,头信息是哪些信息,不懂,望指教
?
laowanggege

TA贡献1条经验 获得超0个赞

同问大佬

查看完整回答
反对 回复 2017-11-29
?
qq_元亨利贞

TA贡献1条经验 获得超0个赞

请问这个原理是什么啊,求教大神!!!

查看完整回答
反对 回复 2017-11-09
  • 3 回答
  • 0 关注
  • 3847 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信