1 回答

TA贡献1827条经验 获得超8个赞
状态代码429表示连接过多。下载器上的请求计数为 1,因为 429 表示拒绝并且不会通过下载器。他们错误地向他们认为是机器人的任何请求提供 429 代码。
经过实验后,由于缺少 cookie 标头,它拒绝了我,该 cookie 标头是在 set-cookie 标头的初始 GET 请求中设置的。这里有一些尝试将 Selenium 作为任何抓取项目中的最后一个选项。
尝试使用像下面这样的完整标题和COOKIES_ENABLED = True.
Host: www.realestate.com.au
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:77.0) Gecko/20100101 Firefox/77.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate, br
Referer: https://duckduckgo.com/
Connection: keep-alive
Upgrade-Insecure-Requests: 1
Pragma: no-cache
Cache-Control: no-cache
TE: Trailers
添加回答
举报