为了账号安全,请及时绑定邮箱和手机立即绑定

Python逐行读取txt中的url文件并进行爬虫

Python逐行读取txt中的url文件并进行爬虫

鸿蒙传说 2019-03-20 17:14:08
毕设项目需要爬取coursera的课程数据,已经把所有课程的url链接爬下来了,存在了txt中,一行是一个课程的url,现在想要获取每门课程的详细信息,如instructor,syllabus 和detail information这几项,但是都需要点进各个课程的网页链接中取爬取。码渣求大神指导一下,来段伪码就更好啦!thx
查看完整描述

1 回答

?
月关宝盒

TA贡献1772条经验 获得超5个赞

你好!不知道这是不是你想要的答案:


f = open("coursera.txt","r")

urlList = f.readlines()

for url in urlList:

    r = requests.get(url)

    ''''''

Good Luck ! ^_<


查看完整回答
反对 回复 2019-04-17
  • 1 回答
  • 0 关注
  • 2762 浏览

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号