为了使A与Z匹配,我们将使用正则表达式:[A-Za-z]如何允许正则表达式匹配用户输入的utf8字符?例如环保部等中文单词
3 回答

GCT1015
TA贡献1827条经验 获得超4个赞
Java正则表达式API适用于该char类型
该char类型隐式为UTF-16
如果您有UTF-8数据,则需要在输入时将其转码为UTF-16
Unicode是通用的字符集,而UTF-8可以描述所有字符(包括控制字符,标点符号,符号,字母等)。您将必须更加明确地确定要包含的内容和要排除的内容。Java正则表达式使用\p{category}语法按类别匹配代码点。请参阅Unicode标准的列表类别。
如果要在表意文字序列中识别和分隔单词,则需要查看更复杂的API。我将从BreakIterator类型开始。
添加回答
举报
0/150
提交
取消