为了账号安全,请及时绑定邮箱和手机立即绑定

为什么输出的网页是重复的内容???

我把解析器里面的res_data字典的初始化放到了__init__构造方法里面,抓取10次后,造成输出的网页是重复的10组内容

http://img1.sycdn.imooc.com//57052fbf00011db407640719.jpg

http://img1.sycdn.imooc.com//57052fd10001c0a805970248.jpg

通过设断点,发现一个邪门的事情,从第2次抓取开始,运行完parser函数(黄框)但是还没运行到collect_data函数(红框),但是HtmlDownloader里面的datas却跟着改变了,这是什么情况啊??难怪造成最后结果是重复的。大神解释下啊,困扰一周了。

http://img1.sycdn.imooc.com//570530650001c2ab07970684.jpg

正在回答

1 回答

同问,也遇到类似状况

0 回复 有任何疑惑可以回复我~
#1

phoenixor 提问者

这个问题我已经解决了,可以去我博客看看 http://blog.csdn.net/sunflowerduidui/article/details/51090404
2016-04-14 回复 有任何疑惑可以回复我~
#2

小小夏歌520 回复 phoenixor 提问者

好的好的 谢谢
2016-04-14 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

为什么输出的网页是重复的内容???

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信