为了账号安全,请及时绑定邮箱和手机立即绑定

python正则表达式

难度初级
时长 1小时29分
学习人数
综合评分9.40
211人评价 查看评价
9.7 内容实用
9.4 简洁易懂
9.1 逻辑清晰
源字符串:aa<div>test1</div>bb<div>test2</div>cc

正则表达式一:<div>.*</div>

匹配结果一:<div>test1</div>bb<div>test2</div>

自行体会非贪婪。

正则表达式二:<div>.*?</div>

匹配结果二:<div>test1</div>
第一次没看懂,然后学习完其他课程回过头再看一遍,真的讲的很清晰,很不错
老师的爬虫视频见!
In [1]: import re

In [2]: import urllib.request
In [3]: req = urllib.request.urlopen('http://www.imooc.com/course/list')
In [4]: buf = req.read()
In [5]: buf = buf.decode('utf-8')
In [6]: listurl = re.findall(r'src=.+\.jpg', buf)
re.split(1,2) 用于分隔字符串
1.正则表达式
2.被拆分的对象
eg: re.split(r':| ',str1) 通过:号或者是空格
re.sub(1,2,3)
1.是正则的筛选匹配公式
2.处理对象(如果是不同字符串直接进行替换,如果是函数就将参数3进行正则筛选出的结果对应的match对象当作参数传入参数2的方法)
3.被操作的对象,可以使字符串或者是文本文件
说得有点让,正则表达式中的小括号是代表分组的意思。如果过后面出现了了\1就是代表匹配的内容与第一个小括号内的东西一样
IGNORANCE re.I 忽略大小写
首先感谢你能使用自己的时间出这期视频,但是不会讲课就不要瞎讲,一点儿逻辑没有让人怎么学,浪费你的世界浪费我们的时间,如果真心想做教育,而不只是为了打广告做宣传,还是好好练课吧! 练的差不多了再出来教学

最新回答 / 芳芳菲菲
因为后边的字符串'<book>'不满足前面的前面的正则要求,重点是弄明白\1是什么意思。可以做两个测试:测试1:pa = re.match(r'<([\w]+>)\1', '<book>book>')pa.groups()测试2:pa = re.match(r'<([\w]+>)', '<book>')pa.groups()

已采纳回答 / 小酸梨ss
因为第一个字符是字母不是数字,所以没有匹配成功

最新回答 / kelvin8496812
<...code...>我想是先匹配后边‘@163.com’,然后找前边的字符4到10位
mmp 辛辛苦苦打的问题,弹出来一个问答窗口,取消就没了,气死了,MD,还得重打!
非贪婪模式倒底有啥意义啊?感觉跟问号差不多,反正就是一次或0次
课程须知
本课程是Python中级课程 1、本课程在linux讲解,最好有linux开发环境 1、熟练掌握Python开发语言基础语法
老师告诉你能学到什么?
1.正则表达式基本语法 2.使用re模块处理文本

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消