为了账号安全,请及时绑定邮箱和手机立即绑定

提取关键部分 内容包含在 <b> 标记中的字符串

提取关键部分 内容包含在 <b> 标记中的字符串

一只斗牛犬 2021-12-08 16:32:28
我只对获取<b>标签内的所有内容感兴趣。有没有最佳方法来做到这一点?据我所知,我只能使用它来实现它,.split但我认为这不是实现它的一种非常优雅或非常理想的方式这是我想要的输出:vSER&nbsp;infinitivo&nbsp;ARTEl&nbsp;masculino&nbsp;&nbsp;singular&nbsp;...这是我对请求的字符串响应
查看完整描述

1 回答

?
回首忆惘然

TA贡献1847条经验 获得超11个赞

您可以使用 html.parser


from html.parser import HTMLParser


class BExtractor(HTMLParser):

    def __init__(self, *args, **kwargs):

        super(BExtractor, self).__init__(*args, **kwargs)

        self.is_b = True


    def handle_starttag(self, tag, attrs):

        if tag == "b":

            self.is_b = True


    def handle_endtag(self, tag):

            self.is_b = False


    def handle_data(self, data):

        if self.is_b:

            print(data)


parser = BExtractor()

parser.feed("""html""")


查看完整回答
反对 回复 2021-12-08
  • 1 回答
  • 0 关注
  • 217 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信