为了账号安全,请及时绑定邮箱和手机立即绑定

不知道为什么,同样的正则表达式,python2爬取的链接都正确,python3爬取的链接返回的url_list有个别错误,有谁知道是什么原因吗?

是不是需要优化正则表达式呢?

用这个做的匹配

list_url = re.findall(r'http:.+?\.jpg', buf)

python2下是正好抓完了szimg和img下的jpg

python3结果看图:

http://img1.sycdn.imooc.com//597f174d0001e17610990142.jpg

请问有谁知道是什么原因吗?

正在回答

2 回答

不是走

0 回复 有任何疑惑可以回复我~

正则表达式不严谨,我也遇到过

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消

不知道为什么,同样的正则表达式,python2爬取的链接都正确,python3爬取的链接返回的url_list有个别错误,有谁知道是什么原因吗?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信