为了账号安全,请及时绑定邮箱和手机立即绑定

脚本无法从重定向的 url 解析标题

脚本无法从重定向的 url 解析标题

holdtom 2021-08-05 18:09:05
我用 selenium 在 python 中编写了一个脚本来从网页中获取标题地址。我在脚本中使用的 url 会在几秒钟内自动重定向。这是我的脚本遇到错误的地方。我正在粘贴该错误的一部分以给您一个想法。ConnectionResetError: [WinError 10054] An existing connection was forcibly closed by the remote hostDuring handling of the above exception, another exception occurred:我试过的脚本:from contextlib import closingfrom selenium import webdriverfrom selenium.webdriver.support import uiurl = "https://www.rightmove.co.uk/propertyMedia/redirect.html?propertyId=30578943&contentId=1625965454&index=1"with closing(webdriver.Chrome()) as wd:    wait = ui.WebDriverWait(wd, 10)    wd.get(url)    item = wait.until(lambda driver: driver.find_element_by_css_selector("h1.header_address__title")).text    print(item)这是我希望从该页面获得的输出:Park View Back Road, Locharbriggs, Dumfries, DG1这是我在该错误之前看到的:
查看完整描述

1 回答

?
天涯尽头无女友

TA贡献1831条经验 获得超9个赞

你可能需要更换

item = wait.until(lambda driver: driver.find_element_by_css_selector("h1.header_address__title")).text

这意味着等待特定元素出现在 DOM 中并立即获取其当前可见的文本(可能返回空字符串)

item = wait.until(lambda driver: driver.find_element_by_css_selector("h1.header_address__title").text)

这意味着等待特定元素并在它不是空字符串时返回其可见文本

但恕我直言,你可以简单地做

item = driver.find_element_by_css_selector("h1.header_address__title").get_attribute('textContent')

获取文本值,即使该文本当前未显示在页面上

至于您的chromedriver that stops working问题:尝试将Chromechromedriver都更新到最新版本


查看完整回答
反对 回复 2021-08-05
  • 1 回答
  • 0 关注
  • 220 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信