最赞回答 / 华灯初上丶
import reimport urllibreq = urllib.request.urlopen('http://www.imooc.com/course/list')#此处加上decode(),不然拿下来的数据都是乱码buf = req.read().decode("utf-8")#老师讲课的url地址已经发生改变,改一下正则匹配就好# listurl = re.findall(r'src=.+\.jpg', buf)listurl = re.findall(r'//img.+?\.jpg', bu...
2017-12-11
最新回答 / 夏至0313
转义字符,因为 . 在正则中表示任意一个字符,但这段代码需要的是 (.jpg),这里面的. 就是. 本身,并不需要它表示任意一个字符,所以需要转义它,\. 代表转义。
2017-11-26
最赞回答 / 华灯初上丶
我用的pycharm,今天才手写的代码,改了几个小地方,都写在注释里面,楼主看看注意到没有,谢谢。import reimport urllibreq = urllib.request.urlopen('http://www.imooc.com/course/list')#此处加上decode(),不然拿下来的数据都是乱码buf = req.read().decode("utf-8")#老师讲课的url地址已经发生改变,改一下正则匹配就好# listurl = re.findall(r'src=.+\.jp...
2017-11-25
最赞回答 / 子非yu_
cat命令是查看文件内容,你直接看图片,它就把图片内容转换成十六进制给你显示出来了。你应该是在linux下遇到的这个情况,我是直接在windows下做的,所以没这个脚本。你可以考虑使用共享文件夹,然后再在windows下查看,或者用老师那个xftp工具
2017-10-31
最赞回答 / JupiterXue
1.url地址必须是http://或者 https:// 这样才行啊2.python 3.x中urllib库和urilib2库合并成了urllib库
2017-10-31
最新回答 / qq_LWQ_1
大爷的,没仔细看。match(pattern, string, flags=0) Try to apply the pattern at the start of the string, returning a match object, or None if no match was found.意思是必须以符合规则的为开头
2017-09-17
已采纳回答 / Poison丶刺心
[1-9]?[0-9]:这个里面是两个部分[1-9]?和[0-9]第一部分:是匹配1到9之间的数字出现0次或1次第二部分:是匹配0到9之间的数字至少出现一次所以匹配‘09’这个字符串的时候,第一部分中不包含‘0’这个字符串,暂时的匹配结果为‘’(即空字符串),所以执行第二部分,第二部分包含‘0’,暂时的匹配结果为‘0’,匹配结束,输出结果‘0’
2017-09-10
已采纳回答 / 赖lai
我猜,打开最新的链接是这样的http://www.imooc.com/course/list?sort=last,如果链接没有参数sort=last的话,慕课网就默认返回的是最热的显示内容吧,毕竟通过最热,可以让用户更好的找到当前热门的自己喜欢的课程吧
2017-09-04