架构图
2018-06-04 11:16:40 0 举报
搜索整体架构
作者其他创作
大纲/内容
问答1. 标题查询 minimum_should_match: 380%2. 正文查询 minimum_should_match: 390%3. 标题查询(去掉 mddid) minimum_should_match: 380%
主要是高亮文本处理截取两段高亮文本,字数分别为30个字符,取到的数据进行首尾特殊字符清洗,例如:)》】,。?:!%;、~—.
参数校验层
关键词转义(一月 -1月)
关键词繁简转换
%
福建福鼎海鲜,北京一日游福鼎海鲜 + 福建福鼎海鲜一日游 + 北京一日游
from/size(-1)
不合法参数修正
传入的参数如果为空值时需要赋予默认值
运行环境
article_guidesales_guidetraveller_guidebookchapter_guide
用 原key bq 去mdd key 查询
mobile层策略
攻略1. 攻略分四种类别,根据类别传入要查询的字段并赋予不同的权重
条件解析层
攻略1. mdd+: minimum_should_match: 100%2. 其他类型的: minimum_should_match: 380%
传入的和预制filter 进行组合拼接
Search逻辑
title_smart^5 | title_ik^5 | title^5 | content_smart^5 | content_ik^5 | content^5
title_smart^10 | title_ik^10 | title^10subtitle_smart^5 | subtitle_ik^5 | subtitle^5content_smart | content_ik | content攻略没有做 bq 查询,为 nestedMdd+则去掉大目的地保留小目的地查询,如:福建福鼎海鲜,当去掉 mdd 后只剩攻略两个字,则保留原始关键词内容,如:西安攻略
计算搜索分词类型
数据处理层
搜索过程
时间、坐标
非mdd:bestGap=1m,acceptGap=3y,boost=1.6,factor=1.2mdd+词:bestGap=1m,acceptGap=1y,boost=0.2,factor=1.0主题词:bestGap=1m,acceptGap=1y,boost=0.8,factor=1.2
关键词清洗
处理 bq 查询所需关键词字段
搜索逻辑层
3台高配 SSD 服务器(256G、1.1T/4、22核)192.168.1.55、192.168.1.56、192.168.1.57连接超时时间为 1s
是否包含主题词 | 是否中英文混搭 | keyLen 10
title_smart^3 | title_ik^2 | title^1 content_smart^3 | content_ik^2 | content^1使用 原关键词 空格 去mdd关键词同时查询
mdd+ 和 theme 类型词:boost=0.1,factor=1其他类型词:boost=1,factor=1
0 条评论
下一页