为了账号安全,请及时绑定邮箱和手机立即绑定

python遇见数据采集

难度初级
时长 2小时 5分
学习人数
综合评分9.63
95人评价 查看评价
9.7 内容实用
9.5 简洁易懂
9.7 逻辑清晰
读取TXT那章有点文不对题啊。。
说的很好,爬虫也要注意原则,不能给对方带来服务器压力。
讲的不错,受教了!
安装了Py3.5出现'HTMLParseError'的同学可以看这个方法:https://www.zhihu.com/question/37949586
出现No module named bs4的看这个方法:http://sandy.epwing.com/archives/12.html

讲师回答 / 秋名山车神
add和header中间有一个下划线
原来你上次在群里说的录的课程就是这个,赞一个!
车神是慕课网学生中成长较快的一枚,当然了来慕课网之前就很努力啊!作为第一期慕星人,现在能够拿知识回馈慕粉,成为慕粉新偶像,大家都像他一样去努力学习吧!

讲师回答 / 秋名山车神
最简单的方式就是使用while True 来无限循环 循环开始的时候检查一下当前时间和设定的时间是否符合  如果符合就运行爬虫  如果不符合就不运行 同时为了性能考虑 可以设定每隔一分钟检查一次 使用sleep方法就可以做到
感谢大家的支持,如果有什么想知道的,可以在评论里面提出来,我看到都会一一回复大家的。
@luckyforever
用的是XX-NET,Github的一个开源项目。
@qq_饱满的阳光_0
不是台湾的,只是有时候经常听台湾的说话,可能说话上面有点跟他们相似。
@狼在北京 谢谢支持
@luckyforever
是用的是XX-NET做的梯子,有兴趣可以去Github上面搜一下。
http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000
课程须知
熟悉Python语言的语法,掌握Python的正则表达式模块,懂得如何使用Python操作数据库
老师告诉你能学到什么?
使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取,以及robots协议和相关注意事项

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消