为了账号安全,请及时绑定邮箱和手机立即绑定

Lucene中用词典分词,如果分不出,是不是就搜不到?

Lucene中用词典分词,如果分不出,是不是就搜不到?

ABOUTYOU 2019-03-29 10:59:55
在lucene中使用字典对中文分词,例如“提出新问题”运用词典可以将“提出新问题”分成:“提出”,“出新”,“问题”,“新问题”但怎样分成“提出”,“出新”,“问题”,“新问题”,“提”,“出”,“新”,“问”,“题”谢谢大家问题解决了正如@gaosboy所说的那样,要做的是如下几步:1.新建一个java文件,继承ISegmenter的接口,譬如叫SingleCharSegmenter2.参照CJKSegmenter的书写方法,主要修改publicvoidanalyze(AnalyzeContextcontext)这个方法3.SingleCharSegmenter中analyze方法利用CJKSegmenter中已经写好的//首字成词//输出当前的词LexemenewLexeme=newLexeme(context.getBufferOffset(),context.getCursor(),1,Lexeme.TYPE_CNWORD);context.addLexeme(newLexeme);4.在IKSegmenter中loadSegmenters方法中,申明segmenters.add(newSingleCharSegmenter());就可以了
查看完整描述

2 回答

?
收到一只叮咚

TA贡献1821条经验 获得超4个赞

你好可不可以把完整的SingleCharSegmenter贴出来看看我自己试了一次不给力呵呵
                            
查看完整回答
反对 回复 2019-03-29
  • 2 回答
  • 0 关注
  • 286 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信