为了账号安全,请及时绑定邮箱和手机立即绑定

我只爬到了一行

为什么我写的只爬到了一行??

https://img1.sycdn.imooc.com//5baaf3230001732c08000107.jpg

正在回答

5 回答

看一下网页下载器中判断获取成功的语句有没有错,用response.staus_code。正则表达式用

'/item/'试试
0 回复 有任何疑惑可以回复我~

肯定是html_parser模块出问题了   要么是正则表达式出现问题  要么是拼接完整URL出了问题  看看是不是少导入了一个模块  import urlparser    

0 回复 有任何疑惑可以回复我~
#1

慕尼黑2527285

请问这里网站升级后的正则表达式应该怎么写?
2018-12-12 回复 有任何疑惑可以回复我~

 我也是

0 回复 有任何疑惑可以回复我~
soup.find_all('a',href=re.compile(r"\”")) 为什么会匹配不到双引号


0 回复 有任何疑惑可以回复我~
#1

慕粉1417129261

然而,不用匹配双引号
2018-11-13 回复 有任何疑惑可以回复我~
links = soup.find_all('a',href=re.compile(r"/item/Python/\d+"))

匹配URL的正则表达式改过了吗?

0 回复 有任何疑惑可以回复我~
#1

慕尼黑2527285

你这里的正则表达式是正确的?能爬出来吗?
2018-12-12 回复 有任何疑惑可以回复我~
#2

墩子_HelloWorld 回复 慕尼黑2527285

可以的
2018-12-12 回复 有任何疑惑可以回复我~
#3

慕尼黑2527285 回复 墩子_HelloWorld

可以爬出多少数据啊?我的报错了:UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-14: ordinal not inrange(128) 可是我每个文件上面都有加#coding: utf8啊……
2018-12-12 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

我只爬到了一行

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信