嘿,我目前正在尝试解析一个网站,我几乎完成了,但是有一个小问题。我想从 html 代码中排除内部标签<span class="moto-color5_5"> <strong>Text 1 </strong> <span style="font-size:8px;">Text 2</span></span>我尝试使用 ...find("span", "moto-color5_5")但这会返回Text 1 Text 2 而不是只返回 Text 1有什么建议么?真诚的:)
1 回答
繁星淼淼
TA贡献1775条经验 获得超11个赞
排除内部标签也会排除Text 1,因为它在内部标签<strong>中。
但是,您可以strong在当前汤中找到:
html = """<span class="moto-color5_5">
<strong>Text 1 </strong>
<span style="font-size:8px;">Text 2</span>
</span>
"""
soup = BeautifulSoup(html)
result = soup.find("span", "moto-color5_5").find('strong')
print(result.text) # Text 1
添加回答
举报
0/150
提交
取消