网络抓取新手,我使用 scrapy 和 python 从特定网站获取所有类别。包含网络源(网络源图片),我一直在尝试的代码如下。我试图隔离类别,这些类别位于“dropdown-submenu”类中每个项目的 href="/categories#" 之后。我试过了 category_urls = response.css("categories").xpath("@href").extract()category_urls = response.css(".link-list-columns").xpath("@href").extract()但我不断收到空列。感谢您提供的任何帮助,谢谢!
1 回答
![?](http://img1.sycdn.imooc.com/54584dc4000118d302200220-100-100.jpg)
MYYA
TA贡献1868条经验 获得超4个赞
我看不到任何名为“类别”的元素,也没有看到名为“链接列表列”的类,因此我不确定该图像是否真的是您正在抓取的页面。(顺便说一句,下次请不要发布图片,要么链接页面,要么复制并粘贴问题中的代码)
假设打印正确,您可以尝试:
response.xpath('//li[@class="dropdown-submenu"]/a/@href').getall()
或者等效的 css
response.css('li.dropdown-submenu a::attr(href)').getall()
添加回答
举报
0/150
提交
取消