为了账号安全,请及时绑定邮箱和手机立即绑定

使用 BeautifulSoup 抓取 IMG SRC

使用 BeautifulSoup 抓取 IMG SRC

守着一只汪 2023-10-17 15:11:45
我正在尝试获取图像的 src,但我返回的 HTML 代码与网站上显示的 HTML 代码不同。from bs4 import BeautifulSoupimport requestsheaders = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}url = "https://www.amazon.de/ASUS-Advanced-Grafikkarte-Speicher-Displayport/dp/B07VM9V59H/ref=sr_1_20?__mk_de_DE=%C3%85M%C3%85%C5%BD%C3%95%C3%91&crid=1928HLQLPKSTH&keywords=nvidia&qid=1585480732&s=computers&sprefix=nvid%2Ccomputers%2C171&sr=1-20"response = requests.get(url, headers=headers).textsoup = BeautifulSoup(response, 'lxml')title = soup.select("#productTitle")[0].get_text().strip()imgdata = soup.find_all('img', {"alt":title})print(imgdata)
查看完整描述

1 回答

?
RISEBY

TA贡献1856条经验 获得超5个赞

这是因为他们将图像编码为 base64,一旦您打开页面,就会在浏览器上呈现该图像。

您可以从另一个属性获取图像 url,如下所示:

img_url = imgdata[0].attrs['data-old-hires']


查看完整回答
反对 回复 2023-10-17
  • 1 回答
  • 0 关注
  • 114 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信