-
group 和 groups查看全部
-
re 的 几种方法查看全部
-
r 代表原字符串查看全部
-
使用正则的过程查看全部
-
search查看全部
-
网页url:<img class="course-banner lazy" data-original="http://img1.sycdn.imooc.com//57fb629000019d3d06000338-240-135.jpg" src="http://img1.sycdn.imooc.com//57fb629000019d3d06000338-240-135.jpg" >, 安照以前的匹配会出错,所以我才用的两次匹配 # -*- coding:utf-8 -*- import re, urllib2 request = urllib2.urlopen('http://www.imooc.com/course/list') buf = request.read() listurl = re.findall(r'src=.+\.jpg',buf) res=[] for url in listurl: a= re.findall(r'http:.+\.jpg',url) res.append(a[0]) for url in res: print url index = 0 for url in res: f = open(str(index)+'.jpg', 'rw') request = urllib2.urlopen(url) buf = request.read() f.write(buf) index = index + 1查看全部
-
re模块的其他方法: search(pattern, string, flags=0) #在一个字符串中查找匹配 findall(pattern, string, flags=0) #返回所有匹配的列表集合 sub(pattern, repl, string, count=0, flags=0) #匹配部分替换为其他值 split(pattern, string, maxsplit=0, flags=0) #根据匹配分割字符串,返回分割字符串组成的列表查看全部
-
分组匹配查看全部
-
^ 匹配字符串的开头 $ 匹配字符串的结尾 | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为number的分组匹配到的字符串 (?P<name>) 分组起别名 (?P=name) 引用别名为name的分组匹配字符串查看全部
-
正则表达式语法 * 匹配0次或无限次 + 匹配1次或无限次 ?匹配0次或1次 {m}/{m,n}匹配m到n次 *?匹配尽可能少匹配,0次 +?匹配1个 ??最多匹配1次,最少不匹配查看全部
-
正则表达式语法: . 匹配任意字符除了换行符 [...] 匹配字符集 ,a-z表示从a到z的所有字符 \d/\D 匹配数字/非数字 \s/\S 匹配空白/非空白 \w/\W 匹配单词字符[a-zA-Z0-9]/非单词字符查看全部
-
1.import re #导入re模块 2.生成pattern对象:pa = re.compile(r'imooc') #匹配的字符 3.生成match对象:ma = pa.match('imooc.com') #被匹配的字符 4.ma.group() ==>imooc #返回匹配的字符 5.ma.span() ==>(0,5) #被匹配字符串所在索引位置 6.ma.string() ==>'imooc.com' #返回被匹配字符串 7.ma.re ==>re.compile(r'imooc') #返回实例查看全部
-
正则表达式运行过程查看全部
-
正则表达式概念查看全部
-
re模块的其他方法: search(pattern, string, flags=0) #在一个字符串中查找匹配 findall(pattern, string, flags=0) #返回所有匹配的列表集合 sub(pattern, repl, string, count=0, flags=0) #匹配部分替换为其他值 split(pattern, string, maxsplit=0, flags=0) #根据匹配分割字符串,返回分割字符串组成的列表查看全部
举报
0/150
提交
取消