为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用美丽的汤从 HTML 中提取数据

如何使用美丽的汤从 HTML 中提取数据

陪伴而非守候 2021-09-25 16:59:07
我正在尝试抓取网页并将结果存储在 csv/excel 文件中。我用的是漂亮的汤。我正在尝试使用 find_all 函数从汤中提取数据,但我不确定如何捕获字段名称或标题中的数据HTML 文件具有以下格式<h3 class="font20"> <span itemprop="position">36.</span>  <a class="font20 c_name_head weight700 detail_page"  href="/companies/view/1033/nimblechapps-pvt-ltd" target="_blank"  title="Nimblechapps Pvt. Ltd.">      <span itemprop="name">Nimblechapps Pvt. Ltd. </span></a> </h3>到目前为止,这是我的代码。不知道如何从这里开始from bs4 import BeautifulSoup as BSimport requests page = 'https://www.goodfirms.co/directory/platform/app-development/iphone? page=2'res = requests.get(page)cont = BS(res.content, "html.parser")names = cont.find_all(class_ = 'font20 c_name_head weight700 detail_page')names = cont.find_all('a' , attrs = {'class':'font20 c_name_head weight700 detail_page'})我曾尝试使用以下 -Input: cont.h3.a.spanOutput: <span itemprop="name">Nimblechapps Pvt. Ltd.</span>我想提取公司名称 - “Nimblechapps Pvt. Ltd.”
查看完整描述

3 回答

  • 3 回答
  • 0 关注
  • 166 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号