为了账号安全,请及时绑定邮箱和手机立即绑定

使用 Go-Colly 抓取时删除空行

使用 Go-Colly 抓取时删除空行

Go
莫回无 2022-05-18 14:54:40
我从 Go 开始,并从 Colly 开始。有人可以帮我从输出中删除空行吗?这是我的代码:package mainimport (    "fmt"    "github.com/gocolly/colly")func main() {    c := colly.NewCollector()    c.OnHTML("table > tbody", func(e *colly.HTMLElement) {        fmt.Println(e.Text)    })    c.Visit("https://www.olx.pl/elektronika/gdynia/")}我试过这个:golang regexp remove all blank lines 和这个:Golang idiomatic way to remove a blank line from a multi-line string,可能是错误的方式,或者我错过了其他东西。
查看完整描述

2 回答

?
ABOUTYOU

TA贡献1812条经验 获得超5个赞

好吧,看起来空行并不是真正的空行,scraper 只是没有打印 DOM 中的元素,这就是为什么我看到抓取的文本之间有这么多的空白。通过告诉刮板我想要刮掉的子元素的特定定位器,这个问题得到了解决。



查看完整回答
反对 回复 2022-05-18
?
qq_笑_17

TA贡献1818条经验 获得超7个赞

我认为您可以尝试标准化空间。


func StandardizeSpaces(s string) string {

    return strings.Join(strings.Fields(s), " ")

}


func main() {

    c := colly.NewCollector()

    c.OnHTML("table > tbody", func(e *colly.HTMLElement) {

        fmt.Println(StandardizeSpaces(e.Text))

    })

    c.Visit("https://www.olx.pl/elektronika/gdynia/")

}


查看完整回答
反对 回复 2022-05-18
  • 2 回答
  • 0 关注
  • 109 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信