我从 Go 开始,并从 Colly 开始。有人可以帮我从输出中删除空行吗?这是我的代码:package mainimport ( "fmt" "github.com/gocolly/colly")func main() { c := colly.NewCollector() c.OnHTML("table > tbody", func(e *colly.HTMLElement) { fmt.Println(e.Text) }) c.Visit("https://www.olx.pl/elektronika/gdynia/")}我试过这个:golang regexp remove all blank lines 和这个:Golang idiomatic way to remove a blank line from a multi-line string,可能是错误的方式,或者我错过了其他东西。
2 回答
ABOUTYOU
TA贡献1812条经验 获得超5个赞
好吧,看起来空行并不是真正的空行,scraper 只是没有打印 DOM 中的元素,这就是为什么我看到抓取的文本之间有这么多的空白。通过告诉刮板我想要刮掉的子元素的特定定位器,这个问题得到了解决。
qq_笑_17
TA贡献1818条经验 获得超7个赞
我认为您可以尝试标准化空间。
func StandardizeSpaces(s string) string {
return strings.Join(strings.Fields(s), " ")
}
func main() {
c := colly.NewCollector()
c.OnHTML("table > tbody", func(e *colly.HTMLElement) {
fmt.Println(StandardizeSpaces(e.Text))
})
c.Visit("https://www.olx.pl/elektronika/gdynia/")
}
- 2 回答
- 0 关注
- 109 浏览
添加回答
举报
0/150
提交
取消