我只需要提取网页中某个部分的链接,但我在 Beautifulsoup 上找到的所有教程总是抓取整个页面。我如何只抓取某个内的链接<div class="xyz">???编辑:我目前有这段代码:soup1.find_all('h3', class_="entry-title td-module-title")这会找到网页的所有链接,这些链接包含在class_="entry-title td-module-title"我想找到类中仍然包含的所有链接"entry-title td-module-title"`但仅包含在以下部分中的那些:<div class="wpb_wrapper">(对不起,如果我的问题有点缺乏信息,我试着添加更多细节)
2 回答
www说
TA贡献1775条经验 获得超8个赞
尝试这个:
soup2 = soup1.find_all('div',class_='wpb_wrapper')
results = []
for div in soup2:
required = div.find_all('h3', class_="entry-title td-module-title")
results.append(required)
翻过高山走不出你
TA贡献1875条经验 获得超3个赞
您可以使用 CSS 选择器来完成此任务:
for link in soup.select('div.wpb_wrapper h3.entry-title.td-module-title a'): print(link['href'])
<h3 class="entry-title td-module-title">
这将打印under 下的所有链接<div class="wpb_wrapper">
。
添加回答
举报
0/150
提交
取消