为了账号安全,请及时绑定邮箱和手机立即绑定

python正则表达式

难度初级
时长 1小时29分
学习人数
综合评分9.40
211人评价 查看评价
9.7 内容实用
9.4 简洁易懂
9.1 逻辑清晰
  • 很好,讲的不错,初中生也能够理解
    查看全部
    0 采集 收起 来源:正则简介

    2017-07-27

  • 抓取网页上的图片 1.获取网页,打开网页 url (实际是向网站发出请求) 2.将获取的 html 文件读到本地中 3.将文件写入本地文件
    查看全部
  • sub()方法中的 repl 参数既可以是替换的字符串,也可以是个函数,sub()的参数中,首先用模式 模式 pattern 去匹配字符串 string 如果匹配到,就会返回一个 match 对象,因此可以编写一个函数传入 match 对象,在函数中使用 match 对象,比如调用 match 的方法 group()--- match.group()
    查看全部
  • ^ 匹配字符串的开头 $ 匹配字符串的结尾 | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为number的分组匹配到的字符串 (?P<name>) 分组起别名 (?P=name) 引用别名为name的分组匹配字符串
    查看全部
  • match()对象的 group()方法返回的是匹配的字符串,而 groups()是以组的形式返回匹配的字符串
    查看全部
  • 正则表达式过程
    查看全部
  • 爬取网站图片过程: import urllib2 //导入urllib2包 req=urllib2.urlopen('http://www.XXXX.com') //对网页发出请求 buf=req.read() //将网页内容读取到buf缓存中 import re urllist = re.findall(r'http:.+\.jpg',buf) //获取图片地址列表 i=0 for url in urllist: f=open(str(i)+'.jpg','wb') //创建一个文件,命名为{str(i).jpg} ‘w’:采用写入方式,若无该文件则创建它 req = urllib2.urlopen(url) //请求该地址内容 buf = req.read() //读取请求信息 f.write(buf) //将buf内容写到文件f中 i+=1
    查看全部
  • search(pattern, string, flags=0) #在一个字符串中查找匹配 findall(pattern, string, flags=0) #返回所有匹配的列表集合 sub(pattern, repl, string, count=0, flags=0) #匹配部分替换为其他值 split(pattern, string, maxsplit=0, flags=0) #根据匹配分割字符串,返回分割字符串组成的列表
    查看全部
  • ^ 匹配字符串的开头 $ 匹配字符串的结尾 | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为number的分组匹配到的字符串 (?P<name>) 分组起别名 (?P=name) 引用别名为name的分组匹配字符串
    查看全部
  • 正则表达式语法 * 匹配0次或无限次 + 匹配1次或无限次 ?匹配0次或1次 {m}/{m,n}匹配m到n次 *?匹配尽可能少匹配,0次 +?匹配1个 ??最多匹配1次,最少不匹配
    查看全部
  • . 匹配任意一个字符。 [abc] 匹配中括号内的任意一个字符 /d /D 匹配任意一个数字 匹配任意一个非数字 /s /S 匹配一个空格 匹配任意一个非空格 /w /W 匹配一个单词型(字母和数字) /W匹配一个非单词型
    查看全部
  • import urllib2#导入模块 import re req = urllib2.urlopen('http://www.imooc.com/course/list') buf = req.read() listurl = re.findall(r'http:.+\.jpg',buf) i=0 for url in listurl: f = open(str(i)+'.jpg','w') req = urllib2.urlopen(url) buf = req.read() f.write(buf) i += 1
    查看全部
  • Python正则表达式-re模块其他方法 1.search(pattern,string,flag=0) #在一个字符串中查找匹配,只查找开头第一个 2.findall(pattern,string,flasg=0) #查找所有匹配,返回所有匹配部分的列表 3.sub(pattern,repl,string,count=0,flags=0) #将字符串中匹配正则表达式的部分替换为其他值 4.split(pattern,string,maxsplit=0,flags=0) #根据匹配分割字符串,返回分割字符串组成的列表
    查看全部
  • 正则表达式语法:(边界匹配) ^ 匹配字符串开头 $ 匹配字符串结尾 \A/\Z 指定的字符串必须出现在开头/结尾 分组匹配: | 匹配左右任意一个表达式 (ab) 括号中表达式作为一个分组 \<number> 引用编号为num的分组匹配到的字符串 (?P<name>) 分组起一个别名 (?P=name) 引用别名为name的分组匹配字符串
    查看全部
  • 正则表达式语法: * 匹配前一个字符0次或者无限次 + 匹配前一个字符1次或者无限次 ? 匹配前一个字符0次或者1次 {m}/{m,n} 匹配前一个字符m次或者n次 *?/+?/??匹配模式变为非贪婪(尽可能少匹配字符)
    查看全部

举报

0/150
提交
取消
课程须知
本课程是Python中级课程 1、本课程在linux讲解,最好有linux开发环境 1、熟练掌握Python开发语言基础语法
老师告诉你能学到什么?
1.正则表达式基本语法 2.使用re模块处理文本

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!