最赞回答 / 慕婉清5269197
在html_parser模块中links = soup.find_all('a', href=re.compile(r'/view/\d+\.htm')) 百度百科修改了页面只需修改爬取规则 把view改成item 再把/\d+\.htm 去掉就能匹配新的url了
2018-01-14
已采纳回答 / 无人与我书半生
是指定Beautiful的解析器为“html.parser”还有BeautifulSoup(markup,"lxml")BeautifulSoup(markup, "lxml-xml") BeautifulSoup(markup,"xml")等等很多种
2018-01-10
最新回答 / weibo_笙箫笑竹_0
pycharm中可以调节字体大小 File-->Settings-->Editor-->Font,然后改变右边的Size的大小值就行了<...图片...>
2018-01-08
最新回答 / 慕勒5286067
opener创建的时候没有加载参数,opener=urllib2.build_opener(urllib2.HTTPCookieProcess(cj))
2018-01-05
已采纳回答 / 慕姐7359191
页面 html_downloader.py15行 print response.read() 更改为 return response.read()
2018-01-04