为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用goquery从HTML页面获取简单文本?

如何使用goquery从HTML页面获取简单文本?

Go
12345678_0001 2021-10-25 11:09:49
我是 Go 的新手。我正在使用goquery从 HTML 页面中提取数据。但问题是我要查找的数据不受任何 HTML 标记的限制。它是<br>标签后的简单文本。我怎样才能提取它?编辑:这是 HTML 代码。<div class="container">    <div class="row">      <div class="col-lg-8">        <p align="justify"><b>Name</b>Priyaka</p>        <p align="justify"><b>Surname</b>Patil</p>        <p align="justify"><b>Adress</b><br>India,Kolhapur</p>        <p align="justify"><b>Hobbies&nbsp;</b><br>Playing</p>        <p align="justify"><b>Eduction</b><br>12th</p>        <p align="justify"><b>School</b><br>New Highschool</p>       </div>    </div></div>由此我想要“Priyanka”和“12th”。
查看完整描述

2 回答

?
陪伴而非守候

TA贡献1757条经验 获得超8个赞

以下是你想要的:


doc.Find(".container").Find("[align=\"justify\"]").Each(func(_ int, s *goquery.Selection) {

    prefix := s.Find("b").Text()

    result := strings.TrimPrefix(s.Text(), prefix)

    println(result)

})

在代码前面导入字符串。如果您需要完整的代码示例,请查看此处。


查看完整回答
反对 回复 2021-10-25
  • 2 回答
  • 0 关注
  • 275 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信