为了账号安全,请及时绑定邮箱和手机立即绑定

无法从自刷新的 websocket 端点获取页面源/DOM

无法从自刷新的 websocket 端点获取页面源/DOM

慕莱坞森 2021-09-25 10:06:27
这是在添加更多文本数据的同时自我刷新的网站。在 Chrome 中,查看页面源代码将不起作用,因为它会无限期地给出空白结果,因此我通常使用 Inspect 来查看源代码。使用硒,无论我是否使用,我似乎都无法获取源代码browser = webdriver.Chrome(executable_path = path_to_chromedriver, chrome_options=options)html_source = browser.page_sourceprint html_source或者browser = webdriver.Chrome(executable_path = path_to_chromedriver, chrome_options=options)html_source = browser.find_elements_by_xpath("//*")print html_source我想要的数据只是作为 html 正文中的文本出现<body><pre style="word-wrap: break-word; white-space: pre-wrap;">: : -1: -1: -1</pre></body>“-1”表示来自 TradingView 服务器的心跳。请注意,TradingView 没有官方的公共 websockets API,因此这是我试图利用的他们自己的内部端点。
查看完整描述

1 回答

?
动漫人物

TA贡献1815条经验 获得超10个赞

这是因为它不是 html 页面而是实时流或text/event-stream,尝试使用requestswithstream=True


import requests

r = requests.get('https://.....', stream=True)


for line in r.iter_lines():

    print(line.decode("utf-8"))

回复


: -1

: -1

: -1


查看完整回答
反对 回复 2021-09-25
  • 1 回答
  • 0 关注
  • 193 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号