为了账号安全,请及时绑定邮箱和手机立即绑定

为何爬京东首页的图片失败啊

import urllib.request
import re

req = urllib.request.urlopen('https://www.jd.com').read().decode('utf-8')
listurl =  re.findall(r'http://.+\.jpg',req)
i = 0
for url in listurl:
   filename = str(i)+'.jpg'
   urllib.request.urlretrieve(url,filename)
   i = i+1

代码如上,跟着老师的思路来的,但是什么都没有返回,请帮忙看看什么原因啊

正在回答

1 回答

爬数据需要分析网页源码,你可以看看京东的图片到底是以什么形式写在网页里的,我敢肯定必然不是"http://.+\.jpg"这种形式。不一定是"http"打头,不一定是jpg格式,可能由js生成,各种情况都存在,你用这种方法抓不到图片很正常

1 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消

为何爬京东首页的图片失败啊

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信