1 回答
TA贡献1836条经验 获得超13个赞
这些内容是使用 javascript 动态生成的,因此使用请求检索 HTML 只会检索静态内容,您可以将 BeautifulSoup 与 Selenium 之类的东西结合起来来实现您想要的:
安装硒:
pip install selenium
然后使用 Firefox 引擎或任何其他支持 JavaScript 的引擎检索内容:
from bs4 import BeautifulSoup
from selenium import webdriver
driver = webdriver.Firefox()
driver.get('https://www.mcfit.com/de/fitnessstudios/studiosuche/studiodetails/studio/berlin-lichtenberg/')
html_content = driver.page_source
soup = BeautifulSoup(html_content, "lxml")
elems = soup.find_all('div', {'class': 'sc-fzoXWK hnKkAN'})
print(elems)
如果您使用 Firefox,则 geckodriver 需要可以通过您的脚本访问,您可以从https://github.com/mozilla/geckodriver/releases下载它并将其放在您的 PATH 中(如果您使用的是 c:/windows OS),因此它可以从任何地方使用。
添加回答
举报