我正在尝试评估跳出率,为了做到这一点,我遍历了网址列表。我的问题是我有这样的字符串,例如:www.example.com/43/test-1www.example2.com/32/test-2我无法找出一个正则表达式来测试字符串是否以这种格式结尾:斜杠号斜杠字符串-> /number/string到目前为止,我设法得到的所有URL都带有斜线之间的数字:[x["page"] for x in data if re.search(r'\d/+$', x["page"])]就是这样
2 回答
慕姐8265434
TA贡献1813条经验 获得超2个赞
我认为您很亲近,只需要稍作修改即可:
re.search(r'\d/[^/]+$', x["page"])
这将匹配倒数第二个路径位置中带有数字的所有URL,最后一个位置中是一个或多个任何类型的字符。
添加回答
举报
0/150
提交
取消