为了账号安全,请及时绑定邮箱和手机立即绑定

php 正则匹配 反斜杠+数字 出现异常,求解

php 正则匹配 反斜杠+数字 出现异常,求解

PHP
慕桂英4014372 2018-09-23 16:57:47
我在修改一个 WordPress 插件,需要从 WordPress 生成的网页源码里截取一部分。但是源码里偶尔有 反斜杠+数字 的情况,匹配的结果异常,结果里会吞掉 反斜杠和后面的两位数字。<?php header('Content-type: text/html; charset=UTF8');// 自己写 demo 测试,不管单引号还是双引号定义的字符串,都不会“吞掉”$str=" <div class=\"post_t\"> 文本文本 \f\1 \9999 <div></div> </div>";$regexp="/\"post_t\".*<div/s"; preg_match($regexp, $str ,$match); echo $match[0];// 但是插件里的这个字符串变量不是我定义的,匹配结果也不一样:// \f 反斜杠后面是字母的话没有变化,输出 \f// \1 反斜杠和数字一起消失,最多消失前两个数字,所以输出是空的// \9999 输出 99我百思不得其解,就算是反斜杠部分被当成了其他进制,也不该吞掉啊。不知各位有没有遇到过这个情况,有什么经验吗,谢谢!
查看完整描述

1 回答

?
狐的传说

TA贡献1804条经验 获得超3个赞

被作为转义字符处理了:反斜杠与数字组合表示对前面匹配的捕获组的引用。
看个正则例子 (\d)\1:它将匹配所有两个连续相等数字,其中的\1表示 与第一个捕获组 \d相同的值。
对于字符串 ss22345, 它将匹配到 22. 反斜杠后的数字表示是对第几个捕获组的引用,正则一般最多只能取到99个捕获组。
故,你的字符串中的\1\99被解析为捕获组引用了,而第一个捕获组合第九十九个捕获组根本不存在,它默认作为空处理了,就是你说的“吞掉”

查看完整回答
反对 回复 2018-09-23
  • 1 回答
  • 0 关注
  • 1029 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信