为了账号安全,请及时绑定邮箱和手机立即绑定

关于正则表达式(零宽度负向断言(?!p))的一个问题

关于正则表达式(零宽度负向断言(?!p))的一个问题

万千封印 2018-09-03 09:09:45
问题: 有字符串:“python php ruby javascript jsonp perhapsphpisoutdated”对于该字符串,使用纯正则获取 所有带p 但是不能包含ph 的单词输出数组 [ 'python', 'javascript', 'jsonp' ]这个问题想了比较久,也没思路我的解法是var result = str.match(/\b\w*(?=p)\w*\b/g)                 .filter((value)=>!/.*(?=ph)/.test(value))console.log(result)虽然能解决问题,但是不符合纯正则的要求群里有大牛给了这么一个答案/\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g完美运行但是我看不懂,希望有大牛能帮我解读
查看完整描述

1 回答

?
跃然一笑

TA贡献1826条经验 获得超6个赞


\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g
\b 是边界字符

所以每一个单词对应的匹配是:
((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)

把这个表达式拆成三部分:

  1. ((?!ph|\s).)*

  2. (p[^h\s]((?!ph|\s).)*)

  3. p

表达式里出现最多的是 ((?!ph|\s).)* 我们来分析一下

《javascript权威指南》里讲: (?!p) 是零宽度负向先行断言,表示接下来的字符不与 p 匹配

这里的 零宽度 是指 它本身不占用匹配
可能这一点比较难理解,举个例子,比如:

计算"1234".match(/((?!34).)*/)的值

  1. 第一次(?!34)之前没有东西、忽略,只对.进行匹配,匹配到"1",字符串剩余"234"

  2. "234"进行匹配,测试"23"是否匹配?!里的"34",结果不匹配,继续进行,"23"没有被消耗,接下来的.匹配到"2",

  3. "34"进行匹配,由于"34"匹配?!里的"34",匹配终止

整个表达式的匹配结果是"12"

结论:/((?!p).)*/形式的表达式匹配到的字符串是p之前的部分

这里再来看之前的三个表达式:

  1. ((?!ph|\s).)*

  2. (p[^h\s]((?!ph|\s).)*)

  3. p

  • 第一个表达式表示匹配单词中 "ph" 或 空格之前的尽量长的字符

  • 第二个表达式匹配单词中 "p" 及之后的字符,要求 "p" 之后的第一个字符不能为 "h",并且同样要求不匹配到 "ph"

  • 第三个表达式匹配 单独的 "p" 字符,因为之前的匹配中最短能匹配到的形式是 p[^h\s],至少为两个字符,而单个"p"字符楼主的要求但未被包括在内,所以单独匹配

梳理一下就会发现,上面的匹配的三个表达式都不匹配 "ph", 但其中一定会有 "p",完全符合题主的要求


补充

问题1 匹配到的结果中包含其它值?

数组的第一项是整个表达式的匹配结果,其他项是括号分组得到的

问题2 /(.(?!34))*/ 和 /((?!34).)*/ 的区别?

/(.(?!34))*//((?!34).)*/少匹配一个数字

在匹配"1234"字符串时,第一次都匹配到"1",第二次匹配时"(.(?!34))*"里的.消耗了"2"导致"34"的负向断言错误,结果"2"也不会匹配,因为外面的括号要求它里面的所有内容匹配,才会匹配,所以整个表达式最终只匹配到"1"


查看完整回答
反对 回复 2018-09-28
  • 1 回答
  • 0 关注
  • 641 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信