为了账号安全,请及时绑定邮箱和手机立即绑定

BeautifulSoup 中的自定义属性?

BeautifulSoup 中的自定义属性?

九州编程 2021-12-29 10:43:29
我正在尝试使用美丽的汤来定位具有非标准属性的 DIV。这是DIV:`<div data-asin="099655596X" data-index="1" class="sg-col-20-of-24 s-result-item sg-col-0-of-12 sg-col-28-of-32 sg-col-16-of-20 sg-col sg-col-32-of-36 sg-col-12-of-16 sg-col-24-of-28" data-cel widget="search_result_1">`我需要 find_all DIV 与 data-asin 属性,并获得 asin 。BS 似乎支持此功能,但我所做的不起作用。这是我不起作用的代码:`rows = soup.find_all(attrs={"data-asin": "value"})`我需要如何在 Python3.7 中制作我的 BS 才能找到所有这些 DIV?
查看完整描述

1 回答

?
幕布斯7119047

TA贡献1794条经验 获得超8个赞

使用 CSS 选择器来实现。


from bs4 import BeautifulSoup

html = '''

<div data-asin="099655596X" data-index="1" class="sg-col-20-of-24 s-result-item sg-col-0-of-12 sg-col-28-of-32 sg-col-16-of-20 sg-col sg-col-32-of-36 sg-col-12-of-16 sg-col-24-of-28" data-cel widget="search_result_1">

'''

soup = BeautifulSoup(html,'html.parser')

items=soup.select('div[data-asin="099655596X"]')

for item in items:

    print(item['data-asin'])

输出:


099655596X

或者


from bs4 import BeautifulSoup

html = '''

<div data-asin="099655596X" data-index="1" class="sg-col-20-of-24 s-result-item sg-col-0-of-12 sg-col-28-of-32 sg-col-16-of-20 sg-col sg-col-32-of-36 sg-col-12-of-16 sg-col-24-of-28" data-cel widget="search_result_1">

'''

soup = BeautifulSoup(html,'html.parser')

items=soup.select('div[data-asin$="X"]')

for item in items:

    print(item['data-asin'])


查看完整回答
反对 回复 2021-12-29
  • 1 回答
  • 0 关注
  • 426 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信