已解决430363个问题，去搜搜看，总会有你想问的

使用 BeautifulSoup 进行网页抓取时出现属性错误

首页猿问使用 BeautifulSoup...

使用 BeautifulSoup 进行网页抓取时出现属性错误

Python

qq_遁去的一_1 2024-01-16 10:38:18

我正在尝试使用 BeautifulSoup 和 Python 从“etherscan.io”中抓取数据。这是网站： https: //etherscan.io/txspage_soups = []for page in range(1, 51): url = 'https://etherscan.io/txs?p=' + str(page) print(url) req = Request(url, headers={'User-Agent': 'Mozilla/5.0'}) webpage = urlopen(req).read() page_soup = soup(webpage, "html.parser").find('tbody').find_all('a') page_soups += page_soup我使用循环来抓取多个网页，但只能获取前 30 页的数据。第31条有错误我检查该网页，发现它仍然具有与其他网页相同的标签和元素。请帮我。

查看完整描述

1 回答

慕哥9229398

TA贡献1877条经验获得超6个赞

这是因为 Cloudflare，我在循环中添加了以下内容：

if page%30 == 0:
    time.sleep(20)

显然，每 30 个页面等待 20 秒就足以不被标记为机器人。

反对回复 2024-01-16

1 回答
0 关注
111 浏览

关注

添加回答

0/150

提交

取消

意见反馈帮助中心 APP下载

官方微信

热搜

最近搜索清空

使用 BeautifulSoup 进行网页抓取时出现属性错误

使用 BeautifulSoup 进行网页抓取时出现属性错误

1 回答

添加回答