为了账号安全,请及时绑定邮箱和手机立即绑定

Scrapy - 试图从另一个标签内部获取标签的文本

Scrapy - 试图从另一个标签内部获取标签的文本

泛舟湖上清波郎朗 2021-07-20 17:13:32
我正在尝试将所有内容都放入 p 标签中,包括嵌套的 b 标签,但是除了 b 之外,我还得到了其他所有内容。有人可以帮我弄这个吗?这是我的代码:def parse(self, response):    images = response.css("#mw-content-text > div > table > tbody  > tr > td > a > img::attr(src)").extract_first()    text1 = response.css("#mw-content-text > div > p::text").extract()     text2 = ''.join(text1)    yield {'text2': text2, 'image_urls':[PROTOCOL+ images]}    for next_page in response.css('#mw-content-text > div > ul > li > b > a::attr(href)').extract():        yield Request(BASE_URL + next_page, callback=self.parse)
查看完整描述

1 回答

?
料青山看我应如是

TA贡献1772条经验 获得超8个赞

您必须在::text让选择器检索最后一个标签下方的所有文本之前使用空格:

text1 = response.css("#mw-content-text > div > p ::text").extract()


查看完整回答
反对 回复 2021-07-27
  • 1 回答
  • 0 关注
  • 166 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信