使用 BeautifulSoup 抓取 IMG SRC

我正在尝试获取图像的 src，但我返回的 HTML 代码与网站上显示的 HTML 代码不同。from bs4 import BeautifulSoupimport requestsheaders = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}url = "https://www.amazon.de/ASUS-Advanced-Grafikkarte-Speicher-Displayport/dp/B07VM9V59H/ref=sr_1_20?__mk_de_DE=%C3%85M%C3%85%C5%BD%C3%95%C3%91&crid=1928HLQLPKSTH&keywords=nvidia&qid=1585480732&s=computers&sprefix=nvid%2Ccomputers%2C171&sr=1-20"response = requests.get(url, headers=headers).textsoup = BeautifulSoup(response, 'lxml')title = soup.select("#productTitle")[0].get_text().strip()imgdata = soup.find_all('img', {"alt":title})print(imgdata)

查看完整描述

1 回答

RISEBY

TA贡献1856条经验获得超5个赞

这是因为他们将图像编码为 base64，一旦您打开页面，就会在浏览器上呈现该图像。

您可以从另一个属性获取图像 url，如下所示：

img_url = imgdata[0].attrs['data-old-hires']

反对回复 2023-10-17

热搜

最近搜索清空

使用 BeautifulSoup 抓取 IMG SRC

使用 BeautifulSoup 抓取 IMG SRC

1 回答

添加回答