为了账号安全,请及时绑定邮箱和手机立即绑定

代码如图,爬出来的全是craw failed,求大神解释?

能运行,但是全是craw failed   http://img1.sycdn.imooc.com//59a81ea60001b75512040687.jpg

http://img1.sycdn.imooc.com//59a81ea60001503912020596.jpg

http://img1.sycdn.imooc.com//59a81ea70001112e14200866.jpg

http://img1.sycdn.imooc.com//59a81ea70001390613130849.jpg

http://img1.sycdn.imooc.com//59a81ea80001dcf511380425.jpg

http://img1.sycdn.imooc.com//59a81f0c000148f014930851.jpg

正在回答

1 回答

  def get_new_url(self):#从url管理器中获取一个新的带爬取得url

        new_url=self.new_urls.pop()#pop方法会从列表中获取url并会移除

        self.old_urls.add(new_url)#将此url添加进old_url

        return new_url

你多了个add

0 回复 有任何疑惑可以回复我~
#1

Silyb 提问者

现在可以了 但是爬出来的网页打开summary部分是乱码,怎么回事啊?
2017-09-01 回复 有任何疑惑可以回复我~
#2

freedom_X20A 回复 Silyb 提问者

#coding:utf8 在html_parser.py加这个试试
2017-09-02 回复 有任何疑惑可以回复我~
#3

Silyb 提问者 回复 freedom_X20A

每个模块都加上了 还是不行
2017-09-05 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

代码如图,爬出来的全是craw failed,求大神解释?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信