laravel开发简书搭建 elasticsearch 进行中文搜索的时候,你会发现,按照视频和 这篇文章: http://www.imooc.com/article/22449 的es:init 搭建完成并且使用 scout:import 导入数据之后,一篇文章包含“爱情”这个中文单词,但是我们搜索的时候,按照“爱” 进行搜索可以搜索出来,但是按照“爱情”搜索却搜索出来条数为0。
这里的原因并不是由于我们的分词错误。按照 http://www.imooc.com/article/22449 这篇文章的表示,我们的分词选择器使用的是 ik_max_word ,可以参考https://github.com/medcl/elasticsearch-analysis-ik 的说明,ik-max-word 会把文本按照字典切割出最多的单词。
问题是出在我们的查询上,我们跟踪
$posts = \App\Post::search($query)->paginate(2);
的源码,最终在vendor/tamayo/laravel-scout-elastic/src/ElasticsearchEngine.php 的里面可以看到
这里的query使用的是{$builder->query} 换句话说,如果我们搜索“爱情”的时候,它实际是搜索“爱情”。这个在中文分词插件ik中就会把带星号的词汇当作单词来进行搜索了(这个scout包这么写的原因也是因为没有考虑到文本分词)。
所以解决办法,把这里的星号给去掉。
就可以进行单词搜索了。
点击查看更多内容
2人点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦