为了账号安全,请及时绑定邮箱和手机立即绑定

爬取之后报错

http://img1.sycdn.imooc.com//57c301540001f3ca11070236.jpg

我只爬5个,其他代码不变

正在回答

1 回答

 def _get_new_data(self, page_url, soup):
        res_data={}
        # url
        res_data['url']=page_url
        # <dd class="lemmaWgt-lemmaTitle-title"><h1>Python</h1>

        title_node=soup.find('dd',class_="lemmaWgt-lemmaTitle-title").find('h1')
        res_data['title']=title_node.get_text()

#         <div class="lemma-summary" label-module="lemmaSummary">
        summary_node = soup.find('div', class_="lemma-summary")
        res_data['summary'] = summary_node.get_text()
        return res_data

看看定义这个方法有没有出错,级res_data['title']

0 回复 有任何疑惑可以回复我~
#1

慕粉3547613 提问者

没看懂啊,能再解释一下吗?谢谢您
2016-09-06 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

爬取之后报错

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信