1 回答

TA贡献1826条经验 获得超6个赞
\b((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)\b/g
\b
是边界字符
所以每一个单词对应的匹配是:((?!ph|\s).)*((p[^h\s]((?!ph|\s).)*)|p)
把这个表达式拆成三部分:
((?!ph|\s).)*
(p[^h\s]((?!ph|\s).)*)
p
表达式里出现最多的是 ((?!ph|\s).)*
我们来分析一下
《javascript权威指南》里讲:
(?!p)
是零宽度负向先行断言,表示接下来的字符不与p
匹配
这里的 零宽度 是指 它本身不占用匹配:
可能这一点比较难理解,举个例子,比如:
计算"1234".match(/((?!34).)*/)
的值
第一次
(?!34)
之前没有东西、忽略,只对.
进行匹配,匹配到"1"
,字符串剩余"234"
对
"234"
进行匹配,测试"23"
是否匹配?!
里的"34"
,结果不匹配,继续进行,"23"
没有被消耗,接下来的.
匹配到"2"
,对
"34"
进行匹配,由于"34"
匹配?!
里的"34"
,匹配终止
整个表达式的匹配结果是"12"
结论:
/((?!p).)*/
形式的表达式匹配到的字符串是p
之前的部分
这里再来看之前的三个表达式:
((?!ph|\s).)*
(p[^h\s]((?!ph|\s).)*)
p
第一个表达式表示匹配单词中
"ph"
或 空格之前的尽量长的字符第二个表达式匹配单词中
"p"
及之后的字符,要求"p"
之后的第一个字符不能为"h"
,并且同样要求不匹配到"ph"
第三个表达式匹配 单独的
"p"
字符,因为之前的匹配中最短能匹配到的形式是p[^h\s]
,至少为两个字符,而单个"p"字符楼主的要求但未被包括在内,所以单独匹配
梳理一下就会发现,上面的匹配的三个表达式都不匹配 "ph"
, 但其中一定会有 "p"
,完全符合题主的要求
补充
问题1 匹配到的结果中包含其它值?
数组的第一项是整个表达式的匹配结果,其他项是括号分组得到的
问题2 /(.(?!34))*/
和 /((?!34).)*/
的区别?
/(.(?!34))*/
比/((?!34).)*/
少匹配一个数字
在匹配"1234"
字符串时,第一次都匹配到"1"
,第二次匹配时"(.(?!34))*"
里的.
消耗了"2"
导致"34"
的负向断言错误,结果"2"
也不会匹配,因为外面的括号要求它里面的所有内容匹配,才会匹配,所以整个表达式最终只匹配到"1"
添加回答
举报