为了账号安全,请及时绑定邮箱和手机立即绑定

结果只输出了源网址,然后就craw failed

代码对比的跟老师的一样了

https://img1.sycdn.imooc.com//5bf1264c0001270f10600214.jpg

正在回答

3 回答

下载器导入改成这个import urllib.request

0 回复 有任何疑惑可以回复我~

我和你的错误一样,去掉try块之后,显示html_parser中的get_text()有错误,

Traceback (most recent call last):
  File "G:\eclipse-workspace(JAVAEE)\Python01\baike_spider\spider_main.py", line 41, in <module>
    obj_spider.craw(root_url)      #启动爬虫
  File "G:\eclipse-workspace(JAVAEE)\Python01\baike_spider\spider_main.py", line 23, in craw
    new_urls, new_data =self.parser.parse(new_url,html_cont)   
  File "G:\eclipse-workspace(JAVAEE)\Python01\baike_spider\html_parser.py", line 40, in parse
    new_data = self._get_new_data(page_url,soup)
  File "G:\eclipse-workspace(JAVAEE)\Python01\baike_spider\html_parser.py", line 27, in _get_new_data
    res_data['title'] =title_node.get_text()
AttributeError: 'NoneType' object has no attribute 'get_text'

0 回复 有任何疑惑可以回复我~

去掉try模块,看一下错误,根据错误改一下

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

结果只输出了源网址,然后就craw failed

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信