已解决430363个问题，去搜搜看，总会有你想问的

如何循环一个 div 并仅使用美丽汤和蟒蛇获取段落标记中的文本？

关注

首页猿问如何循环一个 div...

如何循环一个 div 并仅使用美丽汤和蟒蛇获取段落标记中的文本？

Python

回首忆惘然 2022-09-20 15:30:32

我正在使用美丽汤和python来抓取网页，并仅从网站中提取段落标签中的文本。这是我想抓取的页面我想要所有段落标签中的所有文本。

查看完整描述

1 回答

慕沐林林

TA贡献2016条经验获得超9个赞

始终使用硒作为节省资源的最后手段。

from selenium import webdriver

url = 'https://www.who.int/csr/disease/coronavirus_infections/faq_dec12/en/'

driver = webdriver.Chrome()

try:

driver.get(url)

div_text = driver.find_element_by_id('primary').text

with open('website_content.txt','w') as f:

f.write(div_text)

except Exception as e:

print(e)

finally:

if driver is not None:

driver.close()

你可以通过要求和美丽的汤来实现同样的事情，如下所示：

import requests as rq

from bs4 import BeautifulSoup

response = rq.get(url)

if response.status_code == 200:

soup = BeautifulSoup(response.text,'html.parser')

div_text = soup.find('div',{'id':'primary'}).text

with open('website_content.txt','w') as f:

f.write(div_text)

反对回复 2022-09-20

1 回答
0 关注
60 浏览

关注

添加回答

0/150

提交

取消

意见反馈帮助中心 APP下载

官方微信

热搜

最近搜索清空

如何循环一个 div 并仅使用美丽汤和蟒蛇获取段落标记中的文本？

如何循环一个 div 并仅使用美丽汤和蟒蛇获取段落标记中的文本？

1 回答

添加回答