为了账号安全,请及时绑定邮箱和手机立即绑定

url_manage.py里面总是报TypeError: unhashable type: 'set'的错

我总是报这个错,搜了半天也不知道怎么解决?难道是我的匹配入口地址错了? 现在Python词条的URL是入口页:https://baike.baidu.com/item/Python/407313?fr=aladdin if __name__ == "__main__":    root_url = "https://baike.baidu.com/item/Python"    obj_spider = SpiderMain()    obj_spider.craw(root_url) //我的root_url有错?改怎么填啊?

正在回答

3 回答

settings.py 文件中TEMPLATES中

'DIRS': [os.path.join(BASE_DIR, 'templates')],

是不是多了中括号?

0 回复 有任何疑惑可以回复我~

    好像还是不行也~加你这几句是什么意思啊?

C:\Python27\pythonw.exe D:/word/Python/Crawler_baike/spider_main.py

craw 1 : http://baike.baidu.com/item/Python

Traceback (most recent call last):

  File "D:/word/Python/Crawler_baike/spider_main.py", line 37, in <module>

    obj_spider.craw(root_url)

  File "D:/word/Python/Crawler_baike/spider_main.py", line 22, in craw

    self.urls.add_new_url(new_urls)

  File "D:\word\Python\Crawler_baike\url_manage.py", line 23, in add_new_url

    self.new_urls.add(url)

TypeError: unhashable type: 'set'


Process finished with exit code 1


0 回复 有任何疑惑可以回复我~
if __name__ == '__main__':
    time1 = time.time()
    root_url = 'https://baike.baidu.com/item/Python'
    obj_spider = SpiderMain()
    obj_spider.craw(root_url)
    time2 = time.time()
    print('一共跑了 %s s' % int(time2 - time1))



0 回复 有任何疑惑可以回复我~
#1

因为遇见 提问者

好像还是不行也~加你这几句是什么意思啊? 就把之前的spider_main.py中对应的替换掉嘛~还是报同样的错也
2017-07-20 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

url_manage.py里面总是报TypeError: unhashable type: 'set'的错

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信