elasticsearch
2023-12-12 00:08:41 11 举报
AI智能生成
elasticsearch
作者其他创作
大纲/内容
文档关系
对象类型
很简单查询中好用
嵌套文档
nested query
检索需要在主文档内进行
子主题
parent-child 关系
关系两端的文档都是相互独立的,都有自己的索引
查更加复杂,性能会更差
检索比嵌套而言,不需要在主文档中进行
容易引起性能问题,子文档的分片不均匀
分布式索引架构
默认每个索引创建5个分片
所需最大节点数=分片数*(副本数+1)
路由
底层索引控制
可用的相似度模式
Okaipi BM25
随机偏离模型
基于信息的模型
LM Dirichlet模型
LM Jelinek Mercer模型
准实时更新,提交,及事务日志
索引更新及更新提交
1s刷新
强制刷新接口
事务日志
控制索引合并
合并策略
tiered合并策略
log byte size合并策略
log doc合并策略
合并调度
顺序合并调度器
并发合并调度器
缓存
过滤器缓存
缓存分类
节点级
LRU
索引级
索引级字段缓存配置
字段数据缓存
查询分片缓存
基础概念
查询
query
相关性评分
全文搜索,评分排序
filter
不需要评分
是非过滤,精确匹配
可以使用缓存
节点层面的缓存
请求的过程
1.query阶段
返回的只是相关性分值的结果
2.fetch阶段
通过返回的相关性的结果的id值,去个给节点发送文档获取请求
概念
索引
相当于表
文档
相当于一行数据
字段
相当于列
DSL进阶
默认评分
TF/IDF
计算文档得分因子
文档权重
字段权重
协调因子
逆文档频率
长度范数
查询次数
过滤器的使用
单纯的过滤是不影响文档得分
查询方式
基本查询
组合查询
bool和dismax
无分析查询
term 查询
全文检索查询
match查询
模式匹配查询
前缀查询
相识度查询
more_like_this查询
支持打分操作查询
位置敏感那查询
结构敏感查询
nested one
基本查询
match查询
适合于对于用户输入有分析的场景
子主题
match_all
查询匹配所有的的文档
term
简单的查询,可以查询单个单词
子主题
组合查询
bool查询
dismax
无分析查询
prefix
全文检索
simple_query_string
模糊匹配查询
prefix, regexp,wildcard
相识度查询
结构敏感性查询
nested
has_child
has_parent
top_children
0 条评论
下一页