为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 Lucene 将小写字母应用于字符串

如何使用 Lucene 将小写字母应用于字符串

LEATH 2022-09-28 14:59:02
我开始使用阿帕奇卢塞尼8.0。我想知道如何使用Lucene将我的变量转换为小写字母。我不太确定如何做到这一点,因为我找不到任何例子。我想要的是这样的东西:String textpublic class DocumentLowercase {private Analyzer analyzer; public Analyzer DocAnalysis(Document d) {    analyzer = new StandardAnalyzer();    String text = d.text();    **Here convert String Text into lowercase**    ** maybe using Lower Case Tokenizer? but how? **            return analyzer;}}
查看完整描述

1 回答

?
浮云间

TA贡献1829条经验 获得超4个赞

标准分析仪已经将所有内容转换为小写字母!


在此处查看文档:http://lucene.apache.org/core/8_0_0/core/org/apache/lucene/analysis/standard/StandardAnalyzer.html


他们说:


使用可配置的非索引字列表,使用小写筛选器和停止筛选器筛选标准增强程序。


您还可以在源代码中看到标准分析器包含哪些组件:


  @Override

  protected TokenStreamComponents createComponents(final String fieldName) {

    final StandardTokenizer src = new StandardTokenizer();

    src.setMaxTokenLength(maxTokenLength);

    TokenStream tok = new LowerCaseFilter(src);

    tok = new StopFilter(tok, stopwords);

    return new TokenStreamComponents(r -> {

      src.setMaxTokenLength(StandardAnalyzer.this.maxTokenLength);

      src.setReader(r);

    }, tok);

  }

如果您无论如何都要自定义分析器,则应查看 。CustomAnalyzer


查看完整回答
反对 回复 2022-09-28
  • 1 回答
  • 0 关注
  • 121 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信