为了账号安全,请及时绑定邮箱和手机立即绑定

python正则表达式

难度初级
时长 1小时29分
学习人数
综合评分9.40
211人评价 查看评价
9.7 内容实用
9.4 简洁易懂
9.1 逻辑清晰
urllib2 不能导入,是不是必须使用ipython?
好像没听懂,不知道讲这个干啥用的。最好以目标导向去讲解。
人生中的第一个爬虫,感谢老师。

最赞回答 / 骁勇善战
\1代表第一个分组所引用的内容,改为要下语句:ma=re.match(r'<([\w]+>)\1','<book>book>')
老师讲课有点思路不够清晰,但还是能听懂个大概的
视屏12分46秒处,
利用正则表达式 [a-zA-Z0-9]{6,10}@163.com 匹配字符转 imioocedu12345@163.com
视屏演示结果是 无法匹配
个人认为应该 有结果,且结果为 ocedu12345@163.com
且在如下网址利用工具验证了我的猜测 http://tool.oschina.net/regex/
将得模糊,这个窗口看得我眼花,又别扭,字体还这么大
不怀疑这位老师的技术,但感觉不适合教学,听得有点混乱
不是非要喷,如果说免费的课是引诱大家去买课学习更多知识的话,这个真不算是个成功的体验视频。不过老师确实是老手,敬佩!

最赞回答 / 华灯初上丶
我用的pycharm,今天才手写的代码,改了几个小地方,都写在注释里面,楼主看看注意到没有,谢谢。import reimport urllibreq = urllib.request.urlopen('http://www.imooc.com/course/list')#此处加上decode(),不然拿下来的数据都是乱码buf = req.read().decode("utf-8")#老师讲课的url地址已经发生改变,改一下正则匹配就好# listurl = re.findall(r'src=.+\.jp...
&gt;&gt;&gt; import re
&gt;&gt;&gt; import urllib2
&gt;&gt;&gt; req =urllib2.urlopen(&#039;http://www.mi.com/&#039;)
&gt;&gt;&gt; buf=req.read()
&gt;&gt;&gt; listurl=re.findall(r&#039;src=.+\.jpg&#039;,buf)
&gt;&gt;&gt; listurl
&gt;&gt;&gt; i=0
&gt;&gt;&gt; for url in listurl:
f=open(&#039;E:/python/mi/&#039;+str(i)+&#039;.jpg&#039;,&#039;wb&#039;)
req=urllib2.urlopen(url)
buf=req.read()
f.write(buf)
i+=1
太简单了, 要不是强迫症想把路径刷满才不看咧
group都要对着打,也是醉了...

最赞回答 / 放学路上的小学生
有斜杠,表示后面的. 点号就是点号的意思,没有斜杠的话,点号代表任意一个字符。

已采纳回答 / hannikodo
正则表达式是用来匹配字符串的,字典格式本身就有相当强大的搜索功能了,如果你说是字符串里的字典格式的话,那么按逗号分割,拿出来之后再把他转换成字典格式就行了~
课程须知
本课程是Python中级课程 1、本课程在linux讲解,最好有linux开发环境 1、熟练掌握Python开发语言基础语法
老师告诉你能学到什么?
1.正则表达式基本语法 2.使用re模块处理文本

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消