有一篇混合中英文的文章,我要得到它包含的单词,我用下面的方法,但显然不是很准,请老司机帮助看一下。多谢var str="1.tom:'what's your name.' 1.汤姆:“你的名字是什么?”";
str.match(/[a-zA-Z]+/ig);//执行结果▶["tom", "what", "s", "your", "name"]现状:已经能过滤掉大部分标点、数字、和中文问题:what’s 这种词被拆成了2个数组,我不想要类似what’s和x-ray这种词。如何修改正则表达式把它们排除出去?就是出现what's时,不要what也不要s也不要what's谢谢老司机领路!^_^
1 回答
宝慕林4294392
TA贡献2021条经验 获得超8个赞
var str="1.tom:'what's your name.' 1.汤姆:“你的名字是什么?”";
str.match(/[a-z]+[\-\']?[a-z]*/ig);
// ["tom", "what's", "your", "name"]
添加回答
举报
0/150
提交
取消