为了账号安全,请及时绑定邮箱和手机立即绑定

2017.9.7日 慕课网爬虫

标签:
Node.js

var http=require('http');
var cheerio=require('cheerio');
var url='http://www.imooc.com/learn/348';

function filterChapters(html){
var $=cheerio.load(html);
var chapters=$('.chapter ');
var courseData=[];
chapters.each(function(item){
var chapter=$(this);
chapter.find('strong').find(':nth-child(n)').remove(); //使用此方法,将获取到的子节点的内容移除掉
var chapterTitle=chapter.find('strong').text().replace(/\s+/g,"");
var videos=chapter.find('ul').children('li');
var chapterData={
chapterTitle:chapterTitle,
videos:[]
}

    videos.each(function(item){
        var video=$(this).find('a');
        var len=video.text().replace(/\s+/g,"").length;

        var videoTitle=video.text().replace(/\s+/g,"").substr(0,len-4);
        var id=video.attr('href').split('video/')[1];
        chapterData.videos.push({
            title:videoTitle,
            id:id
        })
    })
    courseData.push(chapterData);
})
return courseData;

}
function printCourseInfo(courseData){
courseData.forEach(function(item){
var chapterTitle=item.chapterTitle;
console.log(chapterTitle+ '\n');
item.videos.forEach(function(video){
console.log('【'+video.id+'】'+ video.title+'\n');
})
})
}

http.get(url,function(res){
var html='';
res.on('data',function(data){
html+=data;
});
res.on('end',function(){
var courseData=filterChapters(html);
printCourseInfo(courseData);
});
}).on('error',function(e){
console.log(e);
});

点击查看更多内容
1人点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消