为了账号安全,请及时绑定邮箱和手机立即绑定

为什么只爬取了两个url就结束了,而且output.html文件里没有任何内容。求老师帮解答,谢谢啦!

craw   1 : https://baike.baidu.com/item/Python/407313
craw   2 : https://baike.baidu.com/item/Web/150564

Process finished with exit code 0

正在回答

2 回答

links=soup.find_all("a", href=re.compile(r"/item/*"))

html_download 里这里要处理下

url = urllib.parse.quote(url, safe='/:?=.')  # 解决地址中有中文的问题
resp = urllib.request.urlopen(url)


0 回复 有任何疑惑可以回复我~

parser文件中将

links = soup.find_all('a', href=re.compile(r"/item/"))

这样写。

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

为什么只爬取了两个url就结束了,而且output.html文件里没有任何内容。求老师帮解答,谢谢啦!

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信