-
语法1查看全部
-
参数repl: 如果是字符串的时候可直接进行替换。 如果函数的话,sub()会先匹配string,然后把匹配到的内容返回给repl,然后由repl函数接收,并在函数中处理接收到的数据。查看全部
-
1.import re #导入re模块 2.生成pattern对象:pa = re.compile(r'imooc') #匹配的字符 3.生成match对象:ma = pa.match('imooc.com') #被匹配的字符 4.ma.group() ==>imooc #返回匹配的字符 5.ma.span() ==>(0,5) #被匹配字符串所在索引位置 6.ma.string() ==>'imooc.com' #返回被匹配字符串 7.ma.re ==>re.compile(r'imooc') #返回实例查看全部
-
正则语法查看全部
-
这个赞 哈哈哈查看全部
-
记住哈查看全部
-
写法 请记住查看全部
-
#^ 匹配字符串的开头 #$ 匹配字符串的结尾 ma = re.match(r'^[a-zA-Z0-9]{6,10}@[/w]*.COM$','760799578@QQ.COM') #\A必须以我为字符串的开头 ma = re.match(r'\Aimmoc[\w]*','immocpython') #| 匹配左右任意一个表达式 ma = re.match(r'abc|d','abc') #(ab) 括号中表达式作为一个分组 ma = re.match(r'^[\w]{4,6}@(163|126).(COM|com)$','760799578@QQ.COM') #\<number> 引用编号为number的分组匹配到的字符串 ma = re.match(r'<([\w]+)[\w]+</\1','<book>python</book>') #(?P<name>) 分组起别名 ma = re.match(r'<(?P<mark>[\w]+)[\w]+</(?P=mark)','<book>python</book>') #(?P=name) 引用别名为name的分组匹配字符串查看全部
-
#[A-Z][a-z]* Adasdas * = 0到无穷大 ma = re.match(r'[A-Z][a-z]*','Afsdsdf') # [_a-zA-z]+[_\w]* + = 1到无穷大 ma = re.match(r'[_a-zA-z]+[_\w]*','_ht11') # [1-9]?[0-9] ? = 0到1 ma = re.match(r'[1-9]?[0-9]','87') # {m}/{m,n} = m次或者m到n次 ma = re.match(r'[a-zA-Z0-9]{6,10}@[/w]*.com','760799578@QQ.COM') # *?或者+?或者??非贪婪,见好就收(上面的加?) ma = re.match(r'[0-9][a-z]*?','lbc')查看全部
-
抓取图片查看全部
-
pattern:正则表达式的字符串或原生字符串 string:需要和这个正则表达式匹配的字符串 flags:正则表达式使用时的控制标记 flags:正则表达式使用时的控制标记 re.I 忽略正则表示是的大小写,[a-z]可以匹配大写 re.M 正则表达式中的^操作符能够将给定的字符串的每行当做匹配的开始 re.S 正则表达式中的.点操作符能够匹配所有的字符,默认匹配除换行符外的所有字符查看全部
-
() 是为了提取匹配的字符串。表达式中有几个()就有几个相应的匹配字符串。 (\s*)表示连续空格的字符串。 []是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示相应位置的字符要匹配英文字符和数字。[\s*]表示空格或者*号。 {}一般用来表示匹配的长度,比如 \s{3} 表示匹配三个空格,\s[1,3]表示匹配一到三个空格。 (0-9) 匹配 '0-9′ 本身。 [0-9]* 匹配数字(注意后面有 *,可以为空)[0-9]+ 匹配数字(注意后面有 +,不可以为空){1-9} 写法错误。 [0-9]{0,9} 表示长度为 0 到 9 的数字字符串。查看全部
-
除了简单地判断是否匹配之外,正则表达式还有提取子串的强大功能。用()表示的就是要提取的分组(Group)。 如果正则表达式中定义了组,就可以在Match对象上用group()方法提取出子串来。 注意到group(0)永远是原始字符串,group(1)、group(2)……表示第1、2、……个子串。查看全部
-
匹配有效的XML标签查看全部
-
#写入模式要用wb,如果用w,下载图片大部分是空的 import re import urllib2 req = urllib2.urlopen('http://www.imooc.com/course/list') buf = req.read() listurl = re.findall(r'http:.+\.jpg', buf) i = 0 for url in listurl: f = open(str(i) + '.jpg', 'wb') req = urllib2.urlopen(url) buf = req.read() f.write(buf) i += 1查看全部
举报
0/150
提交
取消