为了账号安全,请及时绑定邮箱和手机立即绑定

在Python上使用selenium或beautifulsoup从带有链接的页面中抓取数据

在Python上使用selenium或beautifulsoup从带有链接的页面中抓取数据

慕田峪7331174 2023-08-08 10:00:19
我想知道如何抓取这个网站:https://1997-2001.state.gov/briefings/statements/2000/2000_index.html它只包含'a'和'href',没有类或ID,结构非常简单。我想运行一个字符串来抓取页面上所有链接的内容。我已经使用 chromedriver 尝试过这段代码,但它只打印了链接列表(我在网络抓取方面非常业余)。任何帮助都会很棒。    >>> elems = driver.find_elements_by_xpath("//a[@href]")     >>> for elem in elems:     ...     print(elem.get_attribute("href"))
查看完整描述

目前暂无任何回答

  • 0 回答
  • 0 关注
  • 118 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信