课程
/后端开发
/Python
/Python开发简单爬虫
我的只打印一个就跳出异常
2016-06-30
源自:Python开发简单爬虫 7-7
正在回答
我的一开始也是这个问题,然后把解析器里面的如图的函数的urlparse.urljoin函数写正确了,一开始我写的是join,你们试试是不是这个原因。(我改过之后就在爬取网页了)
流浪在海洋
DarkMan 回复 流浪在海洋
解决了 谢谢一楼的方法
解决了 谢谢
这个问题很多同学都出现过,导包的时候要注意,两种导入包的方式是有点区别的,我的是由于导入BeautifulSoup时写成import BeautifulSoup了,改成from bs4 import BeautifulSoup就好了,你可以试一下
迷你熊
问题很多 慢慢找吧
我也遇到这个问题了,不过经过调试已经解决掉了,发出来供大家参考。
这个应该是BeautifulSoup版本造成的格式问题,我将html_parser.py中涉及title_node和summary_node的语句,改成下面的格式,重新运行就可以正常输出了。
title_node = soup.find("dd", attrs={"class":"lemmaWgt-lemmaTitle-title"}).find("h1")
summary_node = soup.find('div', attrs={"class":"lemma-summary"})
希望对你有所帮助。
沸腾cqcp
落云殇
熊孩子3657953
我的也是这样,求解啊
craw 1 :http://baike.baidu.com/view/21087.htm
craw failed
Process finished with exit code 0
我也这样
举报
本教程带您解开python爬虫这门神奇技术的面纱