为了账号安全,请及时绑定邮箱和手机立即绑定

如何用beautifulsoup提取网页某一部分的所有链接?

如何用beautifulsoup提取网页某一部分的所有链接?

肥皂起泡泡 2023-03-01 15:32:47
我只需要提取网页中某个部分的链接,但我在 Beautifulsoup 上找到的所有教程总是抓取整个页面。我如何只抓取某个内的链接<div class="xyz">???编辑:我目前有这段代码:soup1.find_all('h3', class_="entry-title td-module-title")这会找到网页的所有链接,这些链接包含在class_="entry-title td-module-title"我想找到类中仍然包含的所有链接"entry-title td-module-title"`但仅包含在以下部分中的那些:<div class="wpb_wrapper">(对不起,如果我的问题有点缺乏信息,我试着添加更多细节)
查看完整描述

2 回答

?
www说

TA贡献1775条经验 获得超8个赞

尝试这个:


soup2 =  soup1.find_all('div',class_='wpb_wrapper')

results = []

for div in soup2:

    required = div.find_all('h3', class_="entry-title td-module-title")

    results.append(required)


查看完整回答
反对 回复 2023-03-01
?
翻过高山走不出你

TA贡献1875条经验 获得超3个赞

您可以使用 CSS 选择器来完成此任务:

for link in soup.select('div.wpb_wrapper h3.entry-title.td-module-title a'):
    print(link['href'])

<h3 class="entry-title td-module-title">这将打印under 下的所有链接<div class="wpb_wrapper">


查看完整回答
反对 回复 2023-03-01
  • 2 回答
  • 0 关注
  • 173 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信