为了账号安全,请及时绑定邮箱和手机立即绑定

我的只打印一个就跳出异常

我的只打印一个就跳出异常

正在回答

8 回答

http://img1.sycdn.imooc.com//579029d50001581d05120186.jpg

我的一开始也是这个问题,然后把解析器里面的如图的函数的urlparse.urljoin函数写正确了,一开始我写的是join,你们试试是不是这个原因。(我改过之后就在爬取网页了)

http://img1.sycdn.imooc.com//57902a7400010e1e04680253.jpg

0 回复 有任何疑惑可以回复我~
#1

流浪在海洋

请问一下你用的是python2.7还是3.x
2016-08-05 回复 有任何疑惑可以回复我~
#2

DarkMan 回复 流浪在海洋

2.7
2016-08-17 回复 有任何疑惑可以回复我~

解决了  谢谢一楼的方法


0 回复 有任何疑惑可以回复我~

解决了 谢谢


0 回复 有任何疑惑可以回复我~

这个问题很多同学都出现过,导包的时候要注意,两种导入包的方式是有点区别的,我的是由于导入BeautifulSoup时写成import BeautifulSoup了,改成from bs4 import BeautifulSoup就好了,你可以试一下

0 回复 有任何疑惑可以回复我~
#1

迷你熊

我这块没有问题但还是不行
2016-07-29 回复 有任何疑惑可以回复我~

问题很多 慢慢找吧

0 回复 有任何疑惑可以回复我~

我也遇到这个问题了,不过经过调试已经解决掉了,发出来供大家参考。

这个应该是BeautifulSoup版本造成的格式问题,我将html_parser.py中涉及title_node和summary_node的语句,改成下面的格式,重新运行就可以正常输出了。

title_node = soup.find("dd", attrs={"class":"lemmaWgt-lemmaTitle-title"}).find("h1")
summary_node = soup.find('div', attrs={"class":"lemma-summary"})

希望对你有所帮助。

2 回复 有任何疑惑可以回复我~
#1

沸腾cqcp

还是不行,好气
2016-07-18 回复 有任何疑惑可以回复我~
#2

落云殇

可以了,多谢
2016-07-22 回复 有任何疑惑可以回复我~
#3

熊孩子3657953

谢谢 终于解决了
2016-08-13 回复 有任何疑惑可以回复我~

我的也是这样,求解啊

0 回复 有任何疑惑可以回复我~

craw 1 :http://baike.baidu.com/view/21087.htm

craw failed


Process finished with exit code 0

我也这样

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

我的只打印一个就跳出异常

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信