最赞回答 / Sias丶殇
我也遇到了这个问题,我已经解决了。系统为Win7, Pycharm Community Edition5.0.1。先把第一行的from baike_spider去掉,然后光标放到UrlManager再Alt+Enter键出来选择下拉列表,选择第一个,创建了class UrlManager()。之后可以看到url管理器的几个方法都已经高亮显示了。把光标add_new_url()按Alt+Enter键可以创建该方法。
2018-08-05
最新回答 / qq_passerby_13
from bs4 import BeautifulSoupimport reimport urlparseclass HtmlParser(object): def _get_new_urls(self, page_url, soup): new_urls=set() links=soup.find_all('a',href=re.compile(r"/view/\d+\.html")) for link in links: ne...
2018-07-31
最赞回答 / scale0116
我也是用的Python3,第一次运行的时候也出现这样的warning,后来我查了一下发现在python3中,默认为UTF-8,所以要去掉报错的话只要去掉下面这句就行。
from_encoding='utf-8'改成<...code...>你再运行一下就可以发现不报错了
2018-07-25
最新回答 / 本本小生
修改成:title_node = soup.find('dl', class_='lemmaWgt-lemmaTitle lemmaWgt-lemmaTitle-').find('h1') 因为百度百科有些页面里没有 ('dd',class='lemmaWgt-lemmaTitle-title')这个元素。 但是一定会有('dl', class_='lemmaWgt-lemmaTitle lemmaWgt-lemmaTitle-')。 我也是测试半天才发现这个原因的,希望能帮到你。
2018-07-23