为了账号安全,请及时绑定邮箱和手机立即绑定

Python开发简单爬虫

蚂蚁帅帅 全栈工程师
难度初级
时长 1小时14分
学习人数
综合评分9.67
646人评价 查看评价
9.9 内容实用
9.6 简洁易懂
9.5 逻辑清晰
爬虫很有用呢,特别是对于我这种宅……不是……爱学习的人,可以很好的整理网络资料
求帮助,没有用老师的软件,直接用的python安装了bs4, 这个爬虫该怎么运行啊?用IDLE运行spider-main文件,错误显示没有spider_baike-master这个module, 有大神可以解答一下吗,在线或者我qq1648862130
正所谓师傅领进门,这就是一个很好的爬虫入门教程,非常感谢这位老师。膜拜膜拜膜拜。
老师讲的非常好,希望能开更多的课程!!!
爬虫成功!自学的Python,从python入门到python基础再到这个入门的爬虫python程序一共花了我差不多一个月的时间,当然我有java基础,理解python要更容易。
话说回来,自学python,给我收获最大的是,编程语言和高级编程语言的区别和优差,让我对编程有了更深层的理解。想起当年学习java那时不能理解的痛苦到后来理解,直到现在的过程真的是柳暗花明又一村!
加油!程序员的世界也很简单,就是程序运行成功看到结果时的那思快乐!
感谢慕课网!
能爬取1000条记录但是报错
视频每节不到两分钟太短了,10分钟左右比较合适,希望改进
凹的布的...
@时间旅行

我的第二条爬到史记上去了,然后就failed了,然后就没有然后了

这是因为_get_new_urls 方法的 return 写在for 里面了,我就是犯了这个低级的错误。
@慕粉1357041190
我的第二条爬到史记上去了,然后就failed了,然后就没有然后了
这是因为_get_new_urls 方法的 return 写在for 里面了,我就是犯了这个低级的错误。
File "C:\Users\Administrator\eclipse-workspace\imooc\src\test\test_urllib2.py", line 2
SyntaxError: Non-ASCII character '\xc4' in file C:\Users\Administrator\eclipse-workspace\imooc\src\test\test_urllib2.py on line 3, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
求解惑
URL管理器
实现方式
内存
课程须知
本课程是Python语言开发的高级课程 1、Python编程语法; 2、HTML语言基础知识; 3、正则表达式基础知识;
老师告诉你能学到什么?
1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块:URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码,修改本代码,你就能抓取任何互联网网页!

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消