为了账号安全,请及时绑定邮箱和手机立即绑定

src下没有http

为什么我的src标签下没有http??

正在回答

3 回答


import re


import urllib




req = urllib.request.urlopen('http://www.imooc.com/course/list')


#此处加上decode(),不然拿下来的数据都是乱码


buf = req.read().decode("utf-8")




#老师讲课的url地址已经发生改变,改一下正则匹配就好


# listurl = re.findall(r'src=.+\.jpg', buf)


listurl = re.findall(r'//img.+?\.jpg', buf)


# 改成非贪婪模式就行了






#前面没有了http:,那么这里手动加上


for index,app_id in enumerate(listurl):


    listurl[index] = str(app_id).replace('//', 'http://')


    print(index, listurl[index])


print(listurl)






i = 0


for url in listurl:


    #写入模式修改为“wb+”,不然不支持将bytes写入,亲测


    f = open(str(i)+".jpg", "wb+")


    req = urllib.request.urlopen(url)


    buf = req.read()


    f.write(buf)


    i+=1


    f.close()


1 回复 有任何疑惑可以回复我~
#1

慕斯卡凌

非常感谢!
2018-10-21 回复 有任何疑惑可以回复我~

我也是。。所以用正则表达式匹配不到需要的url地址~好尴尬

0 回复 有任何疑惑可以回复我~
#1

qq_慕工程8234668

2021年。 我也是,你的问题解决没有,教教我
2021-03-12 回复 有任何疑惑可以回复我~

有时候url是相对地址,就是说前面还要加上服务器的地址。

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消

src下没有http

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信