-
分布式全文检索引擎,实时快速,restful查看全部
-
ES中文分词器
对中文支持最好的分词器 ik分词器
ik_smart
ik_max_word :我 是 中国人 中国 国人 (可以得到最大分词效果)
已经预置常用的分词
查看全部 -
倒排索引工作原理
1.存入数据时使用分词器拆分数据
2.不同的词源指向不同的Documents(等同于MySQL中的Row)
3.ES会维护最小词源到DocumentID的映射(一个词源可以对应多个)
4.检索关键词时,ES会拆分最小词源,由于数据会存在不同的Document,根据不同的词源,可以共同定位到包含所有关键词的Document,根据权重,返回(例如:查询ABC,根据A可知存有A数据的ID有1.5.7,B数据的ID有2.5.8,D数据的ID有5.9.8,可知同时包含ABC的ID为5)
查看全部 -
概念和适用场景
分布式
全文检索
实时快速
对外暴露Restful接口
查看全部 -
同步数据防止重复数据的sql
查看全部 -
同步mysql数据到es:canal(阿里巴巴,通过定于mysql的binlog实现)或者logstash
查看全部 -
就没大哥写笔记的吗,这讲的很好啊,就是没听懂
查看全部 -
spring.datasource.driverClassName=com.mysql.jdbc.Driver spring.datasource.url=jdbc:mysql://127.0.0.1:3306/how2java?useUnicode=true&characterEncoding=utf8 spring.datasource.username=root spring.datasource.password=root spring.datasource.hikari.maximum-pool-size=20 spring.datasource.hikari.minimum-idle=5 spring.jpa.database-platform=org.hibernate.dialect.MySQLDialect #es spring.data.elasticsearch.cluster-node=127.0.0.1:9300 spring.data.elasticsearch.cluster-name=my-application #mvc spring.mvc.static-path-pattern=/** spring.devtools.livereload.enabled=true spring.devtools.restart.additional-paths=static/** #日期格式化 spring.jackson.date-format=yyyy-MM-dd HH:mm:ss
查看全部 -
POST _analyze
{
"analyzer": "ik_max_word",
"text": "我是中国人"
}
POST _analyze
{
"analyzer": "ik_smart",
"text": "我是中国人"
}
查看全部 -
POST _analyze
{
"analyzer": "ik_max_word",
"text": "我是中国人"
}
查看全部 -
POST _analyze
{
"analyzer": "standard",
"text": "hello world"
}
查看全部 -
查看全部
-
{
"query":{
"bool":{
"should":[
{"match":{ "title":"标题"}
}]
}
}
}
好用
查看全部 -
Java技术栈目前有三种可以选择 Node Client, Transport Client, Rest API, 需要注明的是,官方已经标明NodeClient 已经过期,Transport Client 将在7.x版本开始不再支持, 最终会在7.x 统一到Rest API。目前Transport Client使用范围比较广;Rest API方式兼容性较好;除非在In-memory模式下运行单元测试,否则不推荐NodeClient
查看全部 -
ES与数据库类型的对应
查看全部
举报