为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 BeautifulSoup 提取中间的代码?

如何使用 BeautifulSoup 提取中间的代码?

侃侃尔雅 2022-06-28 10:33:48
我想从下面的片段中提取文本“这是我想要提取的文本”。有没有人有什么建议?谢谢!<span class="cw-type__h2 Ingredients-title">Ingredients</span><p>                                THIS IS THE TEXT I WANT TO EXTRACT</p>
查看完整描述

2 回答

?
犯罪嫌疑人X

TA贡献2080条经验 获得超4个赞

假设可能有更多的 html,我将使用前面的类span与相邻的兄弟组合器和p类型选择器来定位适当的p标签


from bs4 import BeautifulSoup as bs


html = '''

<span class="cw-type__h2 Ingredients-title">Ingredients</span>

<p>

                                THIS IS THE TEXT I WANT TO EXTRACT</p>

                                '''

soup = bs(html, 'lxml')

print(soup.select_one('.Ingredients-title + p').text.strip())


查看完整回答
反对 回复 2022-06-28
?
呼如林

TA贡献1798条经验 获得超3个赞

from bs4 import BeautifulSoup

html = """<span class="cw-type__h2 Ingredients-title">Ingredients</span><p>THIS IS THE TEXT I WANT TO EXTRACT</p>"""

soup = BeautifulSoup(html,'lxml')

print(soup.p.text)


查看完整回答
反对 回复 2022-06-28
  • 2 回答
  • 0 关注
  • 142 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信