为了账号安全,请及时绑定邮箱和手机立即绑定

PHP一段正则表达式匹配结果不一致的问题

PHP一段正则表达式匹配结果不一致的问题

九州编程 2019-04-09 20:25:22
我自定的函数如下,功能是匹配出特殊字符:functionhasSpecialChar($subject){$pattern="/[`~!@#$%^&*()+=|{}':;',\\[\\].\/?~!@#¥%……&*()——+|{}【】‘;:”\"“’。,、?]/";if(preg_match($pattern,$subject)){returntrue;}returnfalse;}我的结果:var_dump(hasSpecialChar('问答社区'));//booleantruevar_dump(hasSpecialChar('Segmentfault'));//booleanfalsevar_dump(hasSpecialChar('@Segmentfault'));//booleantrue可以从第一个结果中看出是'问答社区'这个中文字符串被匹配出了特殊字符,但是我在Rubular上匹配'问答社区'则匹不出特殊字符,请问是不是我哪里写错了?还是preg_match函数的为题呢?一直找不到原因。路过的大哥们帮帮忙,谢谢。
查看完整描述

2 回答

?
呼唤远方

TA贡献1856条经验 获得超11个赞

但是我在Rubular上匹配'问答社区'则匹不出特殊字符
Rubular是基于Ruby的,Ruby1.9以后对中文支持得很不错了。
请问是不是我哪里写错了?
需要加上u修饰符,开启UTF-8支持
$pattern="/[`~!@#$%^&*()+=|{}':;',\\[\\].<>\/?~!@#¥%……&*()——+|{}【】‘;:”\"“’。,、?]/u";
一直找不到原因。
是PHP对中文支持不够好。
中文在PHP里是以16进制保存的,这就带来问题了。
比如,你的例子中,你匹配的那些特殊符号中包括中文的逗号,你告诉PHP的是,我要匹配一组特殊符号,其中包括中文的逗号,[,],但是PHP不认识中文,它听到的是,你要匹配一组数据,其中包括\xef、\xbc、\x8c(中文逗号转换成十六进制),然后你传给它的“问答社区”,其中“区”字转换成十六进制就是\xe5、\x8c、\xba。你可以看到,这里\x8c匹配上了,所以最后结果是true。
同理,你可以尝试找一下答字是因为和哪个特殊符号的十六进制匹配上了?
                            
查看完整回答
反对 回复 2019-04-09
?
莫回无

TA贡献1865条经验 获得超7个赞

php汉字匹配可以考虑mb_相应的函数,例如:mb_ereg(),虽然有些问题,但是大体上能比较省事的解决问题。
如果使用GBK字符集建议考虑转成UTF-8再处理。
                            
查看完整回答
反对 回复 2019-04-09
  • 2 回答
  • 0 关注
  • 357 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信