我有一个奇怪的问题。我从 Google Cloud Vision 获取包含非英文字符的文本,但它们实际上是英文字符。这是谷歌云视觉OCR的一个错误。我得到这样的角色:HélloNotice that é is non English character.我想转换成simple "Hello"这样我可以处理这个词。我不是在寻找编程答案。我只是在寻找方法来做到这一点。任何提示都会有用。谢谢!
1 回答
慕盖茨4494581
TA贡献1850条经验 获得超11个赞
如果 Apache Commons 适合您,您可以使用他们的 StringUtils 库。该stripAccents
方法应适合您的需要。从源代码中您可以看到它实际上使用了java.text.Normalizer
,因此您也可以查看它。
- 1 回答
- 0 关注
- 122 浏览
添加回答
举报
0/150
提交
取消