我想知道如何抓取这个网站:https://1997-2001.state.gov/briefings/statements/2000/2000_index.html它只包含'a'和'href',没有类或ID,结构非常简单。我想运行一个字符串来抓取页面上所有链接的内容。我已经使用 chromedriver 尝试过这段代码,但它只打印了链接列表(我在网络抓取方面非常业余)。任何帮助都会很棒。 >>> elems = driver.find_elements_by_xpath("//a[@href]")
>>> for elem in elems:
... print(elem.get_attribute("href"))
添加回答
举报
0/150
提交
取消