为了账号安全,请及时绑定邮箱和手机立即绑定

使用 BeautifulSoup 从 html 文本中查找和检索内容

使用 BeautifulSoup 从 html 文本中查找和检索内容

慕无忌1623718 2021-08-14 16:06:17
我有以下 html 代码(或者至少我认为它是 html),我正在 Python 上使用 BeautifulSoup。我已经正确地使用 Beautiful Soup 解析了 html。接下来我想做的是检索与包含某个数据标签的“div”相关联的内容(例如,在代码的底部,data-label="Relation")。特别是,我想获得一个字典,它以数据标签的文本作为键,即在我的示例“关系”中,并将相同“div”的内容作为值,即在我的示例中,href“ http: //documenti.camera.it/apps/commonServices/getDocumento.ashx?sezione=bollettini=comunicato=17=2016=06=14=03=data.20160614.com03.bollettino.sede00020.tit00010.int0602010. com03.bollettino.sede00020.tit00010.int00010#data.20160614.com03.bollettino.sede00020.tit00010.int00010 "我尝试了几种方法,但据我所知,数据标签似乎不是一个有效的属性,所以我不确定如何处理这个问题。(请注意,这只是一个示例,但我必须对这些具有类似结构的数千个甚至数百万个网页执行相同的操作)。
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 229 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信