为了账号安全,请及时绑定邮箱和手机立即绑定

如何循环一个 div 并仅使用美丽汤和蟒蛇获取段落标记中的文本?

如何循环一个 div 并仅使用美丽汤和蟒蛇获取段落标记中的文本?

回首忆惘然 2022-09-20 15:30:32
我正在使用美丽汤和python来抓取网页,并仅从网站中提取段落标签中的文本。这是我想抓取的页面我想要所有段落标签中的所有文本。
查看完整描述

1 回答

?
慕沐林林

TA贡献2016条经验 获得超9个赞

始终使用硒作为节省资源的最后手段。


from selenium import webdriver

url = 'https://www.who.int/csr/disease/coronavirus_infections/faq_dec12/en/'

driver = webdriver.Chrome()

try:

  driver.get(url)

  div_text = driver.find_element_by_id('primary').text

  with open('website_content.txt','w') as f:

    f.write(div_text)

except Exception as e:

  print(e)

finally:

  if driver is not None:

    driver.close()

你可以通过要求和美丽的汤来实现同样的事情,如下所示:


import requests as rq

from bs4 import BeautifulSoup



response  = rq.get(url)

if response.status_code == 200:

  soup = BeautifulSoup(response.text,'html.parser')

  div_text = soup.find('div',{'id':'primary'}).text

  with open('website_content.txt','w') as f:

    f.write(div_text)


查看完整回答
反对 回复 2022-09-20
  • 1 回答
  • 0 关注
  • 60 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信