-
很好,讲的不错,初中生也能够理解查看全部
-
抓取网页上的图片 1.获取网页,打开网页 url (实际是向网站发出请求) 2.将获取的 html 文件读到本地中 3.将文件写入本地文件查看全部
-
sub()方法中的 repl 参数既可以是替换的字符串,也可以是个函数,sub()的参数中,首先用模式 模式 pattern 去匹配字符串 string 如果匹配到,就会返回一个 match 对象,因此可以编写一个函数传入 match 对象,在函数中使用 match 对象,比如调用 match 的方法 group()--- match.group()查看全部
-
^ 匹配字符串的开头 $ 匹配字符串的结尾 | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为number的分组匹配到的字符串 (?P<name>) 分组起别名 (?P=name) 引用别名为name的分组匹配字符串查看全部
-
match()对象的 group()方法返回的是匹配的字符串,而 groups()是以组的形式返回匹配的字符串查看全部
-
正则表达式过程查看全部
-
爬取网站图片过程: import urllib2 //导入urllib2包 req=urllib2.urlopen('http://www.XXXX.com') //对网页发出请求 buf=req.read() //将网页内容读取到buf缓存中 import re urllist = re.findall(r'http:.+\.jpg',buf) //获取图片地址列表 i=0 for url in urllist: f=open(str(i)+'.jpg','wb') //创建一个文件,命名为{str(i).jpg} ‘w’:采用写入方式,若无该文件则创建它 req = urllib2.urlopen(url) //请求该地址内容 buf = req.read() //读取请求信息 f.write(buf) //将buf内容写到文件f中 i+=1查看全部
-
search(pattern, string, flags=0) #在一个字符串中查找匹配 findall(pattern, string, flags=0) #返回所有匹配的列表集合 sub(pattern, repl, string, count=0, flags=0) #匹配部分替换为其他值 split(pattern, string, maxsplit=0, flags=0) #根据匹配分割字符串,返回分割字符串组成的列表查看全部
-
^ 匹配字符串的开头 $ 匹配字符串的结尾 | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为number的分组匹配到的字符串 (?P<name>) 分组起别名 (?P=name) 引用别名为name的分组匹配字符串查看全部
-
正则表达式语法 * 匹配0次或无限次 + 匹配1次或无限次 ?匹配0次或1次 {m}/{m,n}匹配m到n次 *?匹配尽可能少匹配,0次 +?匹配1个 ??最多匹配1次,最少不匹配查看全部
-
. 匹配任意一个字符。 [abc] 匹配中括号内的任意一个字符 /d /D 匹配任意一个数字 匹配任意一个非数字 /s /S 匹配一个空格 匹配任意一个非空格 /w /W 匹配一个单词型(字母和数字) /W匹配一个非单词型查看全部
-
import urllib2#导入模块 import re req = urllib2.urlopen('http://www.imooc.com/course/list') buf = req.read() listurl = re.findall(r'http:.+\.jpg',buf) i=0 for url in listurl: f = open(str(i)+'.jpg','w') req = urllib2.urlopen(url) buf = req.read() f.write(buf) i += 1查看全部
-
Python正则表达式-re模块其他方法 1.search(pattern,string,flag=0) #在一个字符串中查找匹配,只查找开头第一个 2.findall(pattern,string,flasg=0) #查找所有匹配,返回所有匹配部分的列表 3.sub(pattern,repl,string,count=0,flags=0) #将字符串中匹配正则表达式的部分替换为其他值 4.split(pattern,string,maxsplit=0,flags=0) #根据匹配分割字符串,返回分割字符串组成的列表查看全部
-
正则表达式语法:(边界匹配) ^ 匹配字符串开头 $ 匹配字符串结尾 \A/\Z 指定的字符串必须出现在开头/结尾 分组匹配: | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为num的分组匹配到的字符串 (?P<name>) 分组起一个别名 (?P=name) 引用别名为name的分组匹配字符串查看全部
-
正则表达式语法: * 匹配前一个字符0次或者无限次 + 匹配前一个字符1次或者无限次 ? 匹配前一个字符0次或者1次 {m}/{m,n} 匹配前一个字符m次或者n次 *?/+?/??匹配模式变为非贪婪(尽可能少匹配字符)查看全部
举报
0/150
提交
取消