为了账号安全,请及时绑定邮箱和手机立即绑定

使用 BeautifulSoup 进行基本的 Python 网页抓取

使用 BeautifulSoup 进行基本的 Python 网页抓取

开心每一天1111 2021-06-10 15:44:45
我对编码很陌生,最近我开始研究网络抓取。我一直在关注本教程并阅读 BS4 文档,但我不明白为什么我的代码不起作用。我正在尝试使用 webscraper提取这篇文章的标题,但它似乎找不到任何与“('div', class_='header')”匹配的标签我的代码:import requestsfrom bs4 import BeautifulSoupSOURCE = requests.get('http://coreyms.com/').textSOUP = BeautifulSoup('SOURCE', 'lxml')HEADER = SOUP.find('div', class_='header')HEADLINE = HEADER.h2.a.hrefprint(HEADLINE)错误信息:Traceback (most recent call last):   File "WSCoreySchafer.py", line 10, in <module>    HEADLINE = ARTICLE.h2.a.hrefAttributeError: 'NoneType' object has no attribute 'h2'
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 95 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信