为了账号安全,请及时绑定邮箱和手机立即绑定

使用 golang 抓取网页内容

使用 golang 抓取网页内容

Go
温温酱 2023-05-08 17:44:37
我是编程语言的初学者,正在学习 scrape。是否可以在这样的评论中获取数据?<tbody id="the-list"><tr>    <td valign="top" align="right">1.</td>    <td valign="top">BEKASI</td>    <td valign="top">Tambun</td>    <td valign="top">Selatan</td>    <td valign="top">01.4.13.16.06.000013</td>    <td valign="top">Jalan</td>    <td valign="top">PERUM BEKASI GRIYA ASRI</td>    <td valign="top">1.500 m<sup>2</sup></td>    <td valign="top" align="center">Kantor</td>    <td valign="top">400 m<sup>2</sup></td>    <td valign="top" align="center">1998</td>                <td valign="top" align="center">> 200</td>    <!--    <td valign="top" align="center">-6.2245</td>    <td valign="top" align="center">107.0827</td>    -->    <td valign="top" align="right">3</td>    <td valign="top" align="right">7</td>    <td valign="top" align="right">2</td>    <td valign="top" align="right">150</td>    <td valign="top">08888123</td>    <td valign="top">-</td></tr>我希望结果可以是这样的1.;BEKASI;Tambun;Selatan;01.4.13.16.06.000013;Jalan;PERUM BEKASI GRIYA ASRI;1.500 m;Kantor;400 m;1998;200;-6.2245;107.0827;3;7;2;150;08888123;-
查看完整描述

1 回答

?
吃鸡游戏

TA贡献1829条经验 获得超7个赞

goquery是解析 html 内容的好库。

    html := `

      <table><tbody id="the-list">

         <tr>

            <td valign="top" align="right">1.</td>

            <td valign="top">BEKASI</td>

            <td valign="top">Tambun</td>

            <td valign="top">Selatan</td>

            <td valign="top">01.4.13.16.06.000013</td>

            <td valign="top">Jalan</td>

            <td valign="top">PERUM BEKASI GRIYA ASRI</td>

            <td valign="top">1.500 m<sup>2</sup></td>

            <td valign="top" align="center">Kantor</td>

            <td valign="top">400 m<sup>2</sup></td>

            <td valign="top" align="center">1998</td>            

            <td valign="top" align="center">> 200</td>


            <!--

            <td valign="top" align="center">-6.2245</td>

            <td valign="top" align="center">107.0827</td>

            -->


            <td valign="top" align="right">3</td>

            <td valign="top" align="right">7</td>

            <td valign="top" align="right">2</td>

            <td valign="top" align="right">150</td>

            <td valign="top">08888123</td>

            <td valign="top">-</td>


        </tr>

   </tbody></table>

`

    doc, _ := goquery.NewDocumentFromReader(strings.NewReader(html))

    sel := doc.Find("#the-list td")

    for i := range sel.Nodes{

        n := sel.Eq(i)

        fmt.Println(n.Text())

    }


查看完整回答
反对 回复 2023-05-08
  • 1 回答
  • 0 关注
  • 163 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信