为了账号安全,请及时绑定邮箱和手机立即绑定

跪求解答,快逼疯了,就能craw一行

把try 去掉 发现这个错误

craw 1:https://baike.baidu.com/item/Python/407313

Traceback (most recent call last):

  File "C:\Users\win8-\eclipse-workspace\FirstPython\baike_spider\spider_main.py", line 32, in <module>

    obj_spider.craw(root_url)

  File "C:\Users\win8-\eclipse-workspace\FirstPython\baike_spider\spider_main.py", line 20, in craw

    self.urls.add_new_urls(new_u)##

  File "C:\Users\win8-\eclipse-workspace\FirstPython\baike_spider\url_manager.py", line 17, in add_new_urls

    for url in urls():                ##

TypeError: 'set' object is not callable


正在回答

3 回答

re.compile(r'^/item/')

0 回复 有任何疑惑可以回复我~

你好:

url入口:https://baike.baidu.com/item/Python/407313

url格式:/item/%E8%B7%A8%E5%B9%B3%E5%8F%B0/8558902

请教:该url的正则表达式怎么写

0 回复 有任何疑惑可以回复我~
#1

宁_静_致_远

/item/.
2018-10-21 回复 有任何疑惑可以回复我~

可能url_manager死循环了,你最好把代码贴上来看看

0 回复 有任何疑惑可以回复我~
#1

慕姐2004059 提问者

解决了,?
2018-06-11 回复 有任何疑惑可以回复我~
#2

简单丶1 回复 慕姐2004059 提问者

怎么解决的 求教 我也是只能抓取一行 之后就输出craw failed
2018-07-04 回复 有任何疑惑可以回复我~
#3

qq_逝去丶忆_0 回复 慕姐2004059 提问者

请问是怎么解决的 我的也是这个问题
2018-07-05 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

跪求解答,快逼疯了,就能craw一行

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信