已解决430363个问题，去搜搜看，总会有你想问的

无法从自刷新的 websocket 端点获取页面源/DOM

首页猿问无法从自刷新的 websocket...

无法从自刷新的 websocket 端点获取页面源/DOM

Python

慕莱坞森 2021-09-25 10:06:27

这是在添加更多文本数据的同时自我刷新的网站。在 Chrome 中，查看页面源代码将不起作用，因为它会无限期地给出空白结果，因此我通常使用 Inspect 来查看源代码。使用硒，无论我是否使用，我似乎都无法获取源代码browser = webdriver.Chrome(executable_path = path_to_chromedriver, chrome_options=options)html_source = browser.page_sourceprint html_source或者browser = webdriver.Chrome(executable_path = path_to_chromedriver, chrome_options=options)html_source = browser.find_elements_by_xpath("//*")print html_source我想要的数据只是作为 html 正文中的文本出现<body><pre style="word-wrap: break-word; white-space: pre-wrap;">: : -1: -1: -1</pre></body>“-1”表示来自 TradingView 服务器的心跳。请注意，TradingView 没有官方的公共 websockets API，因此这是我试图利用的他们自己的内部端点。

查看完整描述

1 回答

动漫人物

TA贡献1815条经验获得超10个赞

这是因为它不是 html 页面而是实时流或text/event-stream，尝试使用requestswithstream=True

import requests

r = requests.get('https://.....', stream=True)

for line in r.iter_lines():

print(line.decode("utf-8"))

: -1

反对回复 2021-09-25

1 回答
0 关注
236 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

无法从自刷新的 websocket 端点获取页面源/DOM

无法从自刷新的 websocket 端点获取页面源/DOM

1 回答

添加回答