课程
/后端开发
/Python
/Python开发简单爬虫
for url in urls: if url not in self.old_urls: self.new_urls.add(url)
如果不添加的话,就会重复爬取吧?
2016-01-15
源自:Python开发简单爬虫 7-3
正在回答
add方法好像还会重复的调用前面的add单个的方法。。所以不用担心
set会覆盖原有的相同信息,所以不必担心
没有必要,因为add_new_urls方法里边又调用到了add方法,判重已经在add中实现了
慕移动2445652
慕移动2445652 回复 慕移动2445652
举报
本教程带您解开python爬虫这门神奇技术的面纱