为了账号安全,请及时绑定邮箱和手机立即绑定

在 Scrapy 中获取图像 URL

在 Scrapy 中获取图像 URL

翻翻过去那场雪 2021-11-09 20:07:16
我对任何形式的编码都很陌生。我通过尝试使用 Scrapy 制作一个简单的爬虫来开始学习过程。它有点工作,但由于某种原因,我无法正确输出图像 URL。它吐出一些“data:image/gif;base64...”值而不是 src 属性中的实际链接。我一直在寻找答案,但似乎找不到任何可以给我明确答案的东西(另外,我也可能不完全理解这个问题)。任何帮助将不胜感激。def parse(self, response):    for data in response.css("a.styles__link--2pzz4"):        yield {            'title': data.css('a::attr(title)').get(),            'price': data.css('span::text').get(),            'url': data.css('a::attr(href)').get(),            'image url': data.css('img::attr(src)').get(),        }        next_page = response.css('li span a::attr(href)').get()        if next_page is not None:            next_page = response.urljoin(next_page)            yield scrapy.Request(next_page, callback=self.parse)  
查看完整描述

2 回答

?
凤凰求蛊

TA贡献1825条经验 获得超4个赞

你能给我们你想抓取的链接吗?

有时网站有延迟加载并隐藏其他img属性中的正常链接。例如data-originaldata-src等还是保留链接,图像jsons,存储在脚本页面上。


查看完整回答
反对 回复 2021-11-09
?
千巷猫影

TA贡献1829条经验 获得超7个赞

您的网站可能使用数据 URI 将图像数据定义为 base64 编码的 blob。基本上,图像数据嵌入在 HTML 中,因此没有可用的正常 URL。在此处阅读更多信息:https : //css-tricks.com/data-uris/


查看完整回答
反对 回复 2021-11-09
  • 2 回答
  • 0 关注
  • 260 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信