为了账号安全,请及时绑定邮箱和手机立即绑定

使用 BeautifulSoup 抓取没有唯一标识符的元素

使用 BeautifulSoup 抓取没有唯一标识符的元素

侃侃无极 2021-07-06 17:14:31
我之前曾在 Python 中进行过少量的网络抓取工作,但我被困在一个可能相当简单的问题上。我想从这个页面上的表格中获取费率。我可以获得诸如单个元素或所有费率之类的信息(因为它们都列在“fccu__slash”类下,但我无法弄清楚如何以可用格式逐行获取结果。这是我的代码的相关部分:FCCU_url = "https://www.fccu.org/Rates/CD-Rates"FCCU_resp = requests.get(FCCU_url, timeout=3)FCCU_soup = BeautifulSoup(FCCU_resp.content, "html.parser")for elem in FCCU_soup.find_all("td"):    try:        print(elem.contents[0])    except IndexError:        print(elem.contents)这会输出我想要的所有信息,但不是可用格式。理想情况下,我希望能够只用我感兴趣的术语抓取 CD,并以这样的格式输出结果(我只关心费率而不是 APY):['3 Month', '0.65%', '0.75%']['6 Month', '1.44%', '1.59%']['2 Year', '2.37%', '2.62%']这些不是我关心的具体内容,但是一旦我了解了如何去做,我就想自己进行调整。提前感谢您的任何帮助。
查看完整描述

3 回答

  • 3 回答
  • 0 关注
  • 169 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信