最新回答 / 芳芳菲菲
因为后边的字符串'<book>'不满足前面的前面的正则要求,重点是弄明白\1是什么意思。可以做两个测试:测试1:pa = re.match(r'<([\w]+>)\1', '<book>book>')pa.groups()测试2:pa = re.match(r'<([\w]+>)', '<book>')pa.groups()
2018-03-09
最新回答 / qq_鑫_4
values = re.findall(r"src.*? ", res)values = [t[len("src="):len(t) - 1] for t in values]
2018-01-24
最赞回答 / 华灯初上丶
import reimport urllibreq = urllib.request.urlopen('http://www.imooc.com/course/list')#此处加上decode(),不然拿下来的数据都是乱码buf = req.read().decode("utf-8")#老师讲课的url地址已经发生改变,改一下正则匹配就好# listurl = re.findall(r'src=.+\.jpg', buf)listurl = re.findall(r'//img.+?\.jpg', bu...
2018-01-21
最赞回答 / 华灯初上丶
import reimport urllibreq = urllib.request.urlopen('http://www.imooc.com/course/list')#此处加上decode(),不然拿下来的数据都是乱码buf = req.read().decode("utf-8")#老师讲课的url地址已经发生改变,改一下正则匹配就好# listurl = re.findall(r'src=.+\.jpg', buf)listurl = re.findall(r'//img.+?\.jpg', bu...
2017-12-11
最新回答 / 夏至0313
转义字符,因为 . 在正则中表示任意一个字符,但这段代码需要的是 (.jpg),这里面的. 就是. 本身,并不需要它表示任意一个字符,所以需要转义它,\. 代表转义。
2017-11-26
最赞回答 / 华灯初上丶
我用的pycharm,今天才手写的代码,改了几个小地方,都写在注释里面,楼主看看注意到没有,谢谢。import reimport urllibreq = urllib.request.urlopen('http://www.imooc.com/course/list')#此处加上decode(),不然拿下来的数据都是乱码buf = req.read().decode("utf-8")#老师讲课的url地址已经发生改变,改一下正则匹配就好# listurl = re.findall(r'src=.+\.jp...
2017-11-25
最赞回答 / 子非yu_
cat命令是查看文件内容,你直接看图片,它就把图片内容转换成十六进制给你显示出来了。你应该是在linux下遇到的这个情况,我是直接在windows下做的,所以没这个脚本。你可以考虑使用共享文件夹,然后再在windows下查看,或者用老师那个xftp工具
2017-10-31
最赞回答 / JupiterXue
1.url地址必须是http://或者 https:// 这样才行啊2.python 3.x中urllib库和urilib2库合并成了urllib库
2017-10-31