为什么输出的网页是重复的内容???
我把解析器里面的res_data字典的初始化放到了__init__构造方法里面,抓取10次后,造成输出的网页是重复的10组内容
通过设断点,发现一个邪门的事情,从第2次抓取开始,运行完parser函数(黄框)但是还没运行到collect_data函数(红框),但是HtmlDownloader里面的datas却跟着改变了,这是什么情况啊??难怪造成最后结果是重复的。大神解释下啊,困扰一周了。
我把解析器里面的res_data字典的初始化放到了__init__构造方法里面,抓取10次后,造成输出的网页是重复的10组内容
通过设断点,发现一个邪门的事情,从第2次抓取开始,运行完parser函数(黄框)但是还没运行到collect_data函数(红框),但是HtmlDownloader里面的datas却跟着改变了,这是什么情况啊??难怪造成最后结果是重复的。大神解释下啊,困扰一周了。
2016-04-06
举报