def process_item(self, item, spider): print('打印的文件地址和名字为')
print(item['file_url'], item['name'])
key_word = {"file_url":item['file_url'] , "name": item['name']} res = self.db.find(key_word)
if list(res):
print('数据量重复')
raise DropItem("Duplicate item found: %s" % item) else: print('*****************************插入数据进入数据库**************************************************')
self.db.insert({"file_url": item['file_url'], "name": item['name']})
return item朋友说我这样查找很慢,让我建立索引?是_id索引吗?
1 回答
- 1 回答
- 0 关注
- 769 浏览
添加回答
举报
0/150
提交
取消