为了账号安全,请及时绑定邮箱和手机立即绑定

pyspider如何手动判断某个url是否已经爬取过

pyspider如何手动判断某个url是否已经爬取过

一只斗牛犬 2019-03-04 16:12:20
想实现爬列表页的时候,发现有已经被爬过的文章url就停止列表爬取,否则继续下一页,如何实现?
查看完整描述

1 回答

?
慕的地8271018

TA贡献1796条经验 获得超4个赞

爬过的url写进记录里面,比如pickle文件。需要的时候调出来检查一下就知道了。

查看完整回答
反对 回复 2019-03-11
  • 1 回答
  • 0 关注
  • 766 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信