1 回答
TA贡献1829条经验 获得超4个赞
标准分析仪已经将所有内容转换为小写字母!
在此处查看文档:http://lucene.apache.org/core/8_0_0/core/org/apache/lucene/analysis/standard/StandardAnalyzer.html
他们说:
使用可配置的非索引字列表,使用小写筛选器和停止筛选器筛选标准增强程序。
您还可以在源代码中看到标准分析器包含哪些组件:
@Override
protected TokenStreamComponents createComponents(final String fieldName) {
final StandardTokenizer src = new StandardTokenizer();
src.setMaxTokenLength(maxTokenLength);
TokenStream tok = new LowerCaseFilter(src);
tok = new StopFilter(tok, stopwords);
return new TokenStreamComponents(r -> {
src.setMaxTokenLength(StandardAnalyzer.this.maxTokenLength);
src.setReader(r);
}, tok);
}
如果您无论如何都要自定义分析器,则应查看 。CustomAnalyzer
添加回答
举报