为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 BeautifulSoup 提取中间的代码?

如何使用 BeautifulSoup 提取中间的代码?

侃侃尔雅 2022-06-28 10:33:48
我想从下面的片段中提取文本“这是我想要提取的文本”。有没有人有什么建议?谢谢!<span class="cw-type__h2 Ingredients-title">Ingredients</span><p>                                THIS IS THE TEXT I WANT TO EXTRACT</p>
查看完整描述

2 回答

?
犯罪嫌疑人X

TA贡献2080条经验 获得超4个赞

假设可能有更多的 html,我将使用前面的类span与相邻的兄弟组合器和p类型选择器来定位适当的p标签


from bs4 import BeautifulSoup as bs


html = '''

<span class="cw-type__h2 Ingredients-title">Ingredients</span>

<p>

                                THIS IS THE TEXT I WANT TO EXTRACT</p>

                                '''

soup = bs(html, 'lxml')

print(soup.select_one('.Ingredients-title + p').text.strip())


查看完整回答
反对 回复 2022-06-28
?
呼如林

TA贡献1798条经验 获得超3个赞

from bs4 import BeautifulSoup

html = """<span class="cw-type__h2 Ingredients-title">Ingredients</span><p>THIS IS THE TEXT I WANT TO EXTRACT</p>"""

soup = BeautifulSoup(html,'lxml')

print(soup.p.text)


查看完整回答
反对 回复 2022-06-28
  • 2 回答
  • 0 关注
  • 149 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号