为了账号安全,请及时绑定邮箱和手机立即绑定

Go语言小爬虫--第一步

标签:
Go


    解析新浪手机新闻网页,获取5条新的新闻的url存入到数据库

  package linksql

  import (

    "database/sql"

    "log"

    _"github.com/go-sql-driver/mysql"

  )

  func Open_url_table() *sql.DB{

    db,err:=sql.Open("mysql","root:root@/mysql")

    Checkerror(err)

    return db

  }

  func Insertlink(id int,src string,url string){

    db:=Open_url_table()

    stmt,err1:=db.Prepare("insert into url_table(id,src,url) values(?,?,?)")

    if err1!=nil{

      log.Fatalln("prepare error",err1)

    }

    _,err2:=stmt.Exec(id,src,url)

    if err2!=nil{

      log.Fatalln("Exec error")

    }

  }

  func Checkerror(err error){   //差错

    if err!=nil{

      log.Fatal(err)

    }

  }

  package search_sina

  import (

    "net/http"

    "log"

    "gopkg.in/xmlpath.v2"

    "test/linksql"

  )

  func Get_url(url string){ //找新URL

    resp,err:=http.Get(url)

    Checkerror(err)

    root,err1:=xmlpath.ParseHTML(resp.Body)

    Checkerror(err1)

    path:=xmlpath.MustCompile(`//dl[@class="f_card"]/../@href`)

    iter:=path.Iter(root)

    i:=1

    for iter.Next() && i<6{

      //fmt.Println(iter.Node())

      linksql.Insertlink(i,"sina",iter.Node().String())

      i++

    }

  }

  func Checkerror(err error){

    if err!=nil{

      log.Fatalln(err)

    }

  }

+----+------+-------------------------------------------------------------------------------+

| id | src  | url                                                                           |

+----+------+-------------------------------------------------------------------------------+

|  1 | sina | http://tech.sina.cn/tech_zt/meitu_ipo?vt=4&pos=18                             |

|  2 | sina | http://tech.sina.cn/i/gj/2016-12-15/detail-ifxytqav9330894.d.html?vt=4&pos=18 |

|  3 | sina | http://zhuanlan.sina.cn/article?vt=4&pos=18&id=57660&ch=tech                  |

|  4 | sina | http://tech.sina.cn/i/gj/2016-12-15/detail-ifxytqax6095612.d.html?vt=4&pos=18 |

|  5 | sina | http://tech.sina.cn/i/gj/2016-12-15/detail-ifxytqav9326149.d.html?vt=4&pos=18 |

+----+------+-------------------------------------------------------------------------------+

©著作权归作者所有:来自51CTO博客作者碰不到繁华的原创作品,如需转载,请注明出处,否则将追究法律责任


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消