我有一个要解析的html表。类似于以下http://sprunge.us/IJUC中的内容。 但是,我不确定解析该信息的好方法。我看过几个html解析器,但是这些解析器似乎都要求所有内容都有一个特殊的标签供您解析,例如获取信息。但是,我的大部分信息都在<td></td>有没有人建议解析此信息?
3 回答
红颜莎娜
TA贡献1842条经验 获得超12个赞
无耻的插件:我的goquery库。这是Go附带的jQuery语法(需要Go的实验性html包,请参见库的README中的说明)。
因此,您可以执行以下操作(假设您的HTML文档已加载到doc中,一个*goquery.Document):
doc.Find("td").Each(func (i int, s *goquery.Selection) {
fmt.Printf("Content of cell %d: %s\n", i, s.Text())
})
编辑:由于goquery文档现在也是一个选择(在v0.2 / master分支中是新增功能),因此在示例中更改doc.Root.Find为doc.Find
- 3 回答
- 0 关注
- 167 浏览
添加回答
举报
0/150
提交
取消