我正在尝试学习网页抓取,但我陷入了我想要的数据被 div 标签包裹的地步,如下所示:<div class="maincounter-number"><span style="color:#aaa">803 </span></div>有几个这样的数据,我需要全部(例如 803)。所以我想我需要做 soup.find_all(...) 但我不知道该放什么进去。有人帮忙吗?我正在 python (Django) 中工作。
1 回答
MYYA
TA贡献1868条经验 获得超4个赞
这应该可以完成您想要做的事情:
from bs4 import BeautifulSoup
html_doc = '<div class="maincounter-number"><span style="color:#aaa">803 </span></div>'
soup = BeautifulSoup(html_doc, 'html.parser')
print(soup.find_all('span', {'style': 'color:#aaa'})[0].get_text())
如果你只想查询div中的文本并按类别搜索:
print(soup.find_all('div', {'class': 'maincounter-number'})[0].get_text())
- 1 回答
- 0 关注
- 80 浏览
添加回答
举报
0/150
提交
取消