为了账号安全,请及时绑定邮箱和手机立即绑定

如何编写一个简易的node爬虫获取任意网址的title呢?

如何编写一个简易的node爬虫获取任意网址的title呢?

长风秋雁 2019-03-07 14:12:50
方法的参数为url 然后 返回值为 title。如:function getTitle(url){ ....... return title}getTitle('http://www.baidu.com')  得到 "百度"getTIttle('http://www.126.com') 得到 "网易邮箱"如何写一个方法获取任意网址的title呢?
查看完整描述

6 回答

?
慕的地10843

TA贡献1785条经验 获得超8个赞

纯前端使用ajax或者iframe都会存在跨域问题。
需要服务端进行请求指定地址,获取到地址对应的页面,然后提取出title标签中内容。

查看完整回答
反对 回复 2019-03-18
?
沧海一幻觉

TA贡献1824条经验 获得超5个赞

使用superagent+cheerio


superagent.get(url)

    .end((err, res) => {

        const $ = cheerio.load(res.text)

        console.log($('title').text())

    })


查看完整回答
反对 回复 2019-03-18
?
蝴蝶不菲

TA贡献1810条经验 获得超4个赞

获取任意网址的html页面,获取页面中<title>标签里面的内容。
如果想封装成一个方法,那就将不同的功能分别写成函数,依次调用。

查看完整回答
反对 回复 2019-03-18
?
慕森卡

TA贡献1806条经验 获得超8个赞

需要通过ajax获取指定url的页面内容,然后再从中分析出其标题


查看完整回答
反对 回复 2019-03-18
?
拉莫斯之舞

TA贡献1820条经验 获得超10个赞

任意是做不到的,因为有的网站对cookie有要求,不符合的话是直接403的。

对于没有验证要求的网站,最基本的使用http.get获取html再解析即可。解析可以用正则或者cheerio


查看完整回答
反对 回复 2019-03-18
  • 6 回答
  • 0 关注
  • 1135 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号