为了账号安全,请及时绑定邮箱和手机立即绑定

python正则表达式

难度初级
时长 1小时29分
学习人数
综合评分9.40
211人评价 查看评价
9.7 内容实用
9.4 简洁易懂
9.1 逻辑清晰
i = 0
for line in url_list:
i += 1
with open(str(i)+".jpg","wb") as f:
try:
re = urllib.request.urlopen('https:'+line)
buf = re.read()
f.write(buf)
except urllib.request.URLError as e:
print(e.reason)
刚爬了淘女郎第一页,很是激动:
url = 'https://mm.taobao.com/tstar/search/tstar_model.do?_input_charset=utf-8'
content = urllib.request.urlopen(url) .read().decode('gbk')
url_buf = re.findall(r'"//.*?"',C_html)
url_list = [re.search(r'//.*?\.(jpg|png)',line).group() for line in url_buf]
干嘛每个字符串都要加{},正则表达式{}不是有特殊含义么
为什么爬下来的图片没法打开呢
看评论才看懂的。老师这节讲的一般。
如果是要读取一系列网址,把这些网址保存咋某个目录下的记事本里面,这样应该如何下载图片?
老师为什么不用开发环境呢?开发环境度么的一目了然,命令行肃然也能看懂但是总得退回去重看,好费事的说!
为什么是Linux而不是windows,弄得我不得不再装一个linux,我能怎么办我也很绝望!
听到第二课就放弃了。。口音 逻辑 IDE都是硬伤= =
本来好激动,因为网上更多的是java的正则表达式,看到这个非常激动,以为有个系统的课程可以学python的正则表达式。。没想到是这个结果
还是听java的然后再在实验中找差别,慢慢积累吧
大家加油
这个课程要基础扎实才能看起来很轻松
很适合有一定基础的同学
最近正想批量从网页上下载图片,简直太及时了
人生第一个爬虫,非常感谢老师!

最赞回答 / Sprint_RS
爬数据需要分析网页源码,你可以看看京东的图片到底是以什么形式写在网页里的,我敢肯定必然不是"http://.+\.jpg"这种形式。不一定是"http"打头,不一定是jpg格式,可能由js生成,各种情况都存在,你用这种方法抓不到图片很正常
urllib2 不能导入,是不是必须使用ipython?
课程须知
本课程是Python中级课程 1、本课程在linux讲解,最好有linux开发环境 1、熟练掌握Python开发语言基础语法
老师告诉你能学到什么?
1.正则表达式基本语法 2.使用re模块处理文本

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消