w我现在用python 爬取网页内用要用到正则表达式,要爬的内容时这样的是img中的 src内容我用python写的正则是这样links = re.findall('<a href=".*?".target=.*?>^[div]<img src="(.*?)".*?>.*?</a>')
可是却匹配到一些我不想要的 比如怎么改一下正则才能不匹配这个带div标签的,谢谢了
1 回答
幕布斯7119047
TA贡献1794条经验 获得超8个赞
试试
links = re.findall('<a href=".*?".target=.*?>\s*<img src="(.*?)".*?>\s*</a>')
- 1 回答
- 0 关注
- 621 浏览
添加回答
举报
0/150
提交
取消