为了账号安全,请及时绑定邮箱和手机立即绑定

python正则表达式

难度初级
时长 1小时29分
学习人数
综合评分9.40
211人评价 查看评价
9.7 内容实用
9.4 简洁易懂
9.1 逻辑清晰

最赞回答 / Sprint_RS
爬数据需要分析网页源码,你可以看看京东的图片到底是以什么形式写在网页里的,我敢肯定必然不是"http://.+\.jpg"这种形式。不一定是"http"打头,不一定是jpg格式,可能由js生成,各种情况都存在,你用这种方法抓不到图片很正常

最赞回答 / 骁勇善战
\1代表第一个分组所引用的内容,改为要下语句:ma=re.match(r'<([\w]+>)\1','<book>book>')

最赞回答 / 华灯初上丶
我用的pycharm,今天才手写的代码,改了几个小地方,都写在注释里面,楼主看看注意到没有,谢谢。import reimport urllibreq = urllib.request.urlopen('http://www.imooc.com/course/list')#此处加上decode(),不然拿下来的数据都是乱码buf = req.read().decode("utf-8")#老师讲课的url地址已经发生改变,改一下正则匹配就好# listurl = re.findall(r'src=.+\.jp...

最赞回答 / 放学路上的小学生
有斜杠,表示后面的. 点号就是点号的意思,没有斜杠的话,点号代表任意一个字符。

最新回答 / Illidan_stormrage
pip管理器是用来管理库的,不是用来运行Python程序的如pip install requests如果要运行 输入python wordcloud.py

最新回答 / 慕雪9488729
里面的数字,是指前面内容出现的次数,如{2}就指前面的内容匹配两次,{2,5}就是指前面的内容匹配2到5次,假如不填,匹配不了任何东西

最赞回答 / qq_守火人_03179824
f= open(str(i)+'.jpg','wb')'w'更换成'wb'

最赞回答 / Noah_________
<...code...>\ 是Python的保留字符,用来转义后面的字符,比如\n是换行...

最新回答 / 慕粉3491563
f = open(str(n)+'.jpg', 'w')   把这一句改为f = open(str(n)+'.jpg', 'wb')  采用二进制的方式写入图片
课程须知
本课程是Python中级课程 1、本课程在linux讲解,最好有linux开发环境 1、熟练掌握Python开发语言基础语法
老师告诉你能学到什么?
1.正则表达式基本语法 2.使用re模块处理文本

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消