我只对获取<b>标签内的所有内容感兴趣。有没有最佳方法来做到这一点?据我所知,我只能使用它来实现它,.split但我认为这不是实现它的一种非常优雅或非常理想的方式这是我想要的输出:vSER infinitivo ARTEl masculino singular ...这是我对请求的字符串响应
1 回答
回首忆惘然
TA贡献1847条经验 获得超11个赞
您可以使用 html.parser
from html.parser import HTMLParser
class BExtractor(HTMLParser):
def __init__(self, *args, **kwargs):
super(BExtractor, self).__init__(*args, **kwargs)
self.is_b = True
def handle_starttag(self, tag, attrs):
if tag == "b":
self.is_b = True
def handle_endtag(self, tag):
self.is_b = False
def handle_data(self, data):
if self.is_b:
print(data)
parser = BExtractor()
parser.feed("""html""")
添加回答
举报
0/150
提交
取消