为了账号安全,请及时绑定邮箱和手机立即绑定

刮Google财经(BeautifulSoup)

刮Google财经(BeautifulSoup)

沧海一幻觉 2019-09-26 15:22:31
刮Google财经(BeautifulSoup)我正在尝试抓取Google财经,并获取“相关股票”表,该表基于Chrome中的网页检查器具有id“ cc-table”和类“ gf-table”。(示例链接:https : //www.google.com/finance?q=tsla)但是当我运行.find(“ table”)或.findAll(“ table”)时,此表不会显示。我可以在Python的HTML内容中找到带有表内容的JSON对象,但不知道如何获取它。有任何想法吗?
查看完整描述

3 回答

?
当年话下

TA贡献1890条经验 获得超9个赞

大多数网站所有者不喜欢刮板程序,因为它们会收集公司价值的数据,用尽整个服务器的时间和带宽,却一无所获。像Google这样的大公司可能会让整个团队采用多种方法来检测和阻止试图抓取其数据的机器人。

有几种解决方法:

  • 从另一个安全性较低的网站上进行抓取。

  • 查看Google或其他公司是否具有供公众使用的API。

  • 使用像Selenium这样的更高级的抓取工具(并且可能仍被Google阻止)。


查看完整回答
反对 回复 2019-09-26
?
慕后森

TA贡献1802条经验 获得超5个赞

在我的示例中,我展示了使用Dryscrape,使用QtWebKit和PyQt5以及硒的方法,您可以分别使用所有三个示例。Dryscrape是我的最爱,但不能在Windows上运行PyQt5是我的下一个最爱,但我发现Selenium很笨重。这里有3个示例,我希望其中一个示例还有其他结帐scrapy-splash。

查看完整回答
反对 回复 2019-09-26
  • 3 回答
  • 0 关注
  • 512 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信