20180223 一般寻址之booster加权
2018-03-20 14:59:49 0 举报
登录查看完整内容
一般寻址之booster加权
作者其他创作
大纲/内容
查看comb是否在host_name_set中
结束
加权区间:[1, 5]加权公式(分段加权)
CombProcess()
开始
获取host_name、host_rank
加权:4+5*log(0.01*rank+1)
对host_name去除/加上后缀,得到host_name_set
更新max_matched_ratio
query的token均在navi_file_token中(all_navi_token)
计算comb与core_title的hits占core_title的比例:matched_ratio_in_title
分段加权:ratio0.5:1.0+2.0*ratio;其他:3+4*log(ratio+0.5)
matched_ratio_in_title0
思想:当raw_query中的所有token都属于导航词汇时,对所有core_title中包含raw_query的主页进行微量加权
ComputeInternal()
matched_ratio_in_comb==1.0
加权:kNaviFactor = 1.3
计算comb与core_title的hits占comb的比例:matched_ratio_in_comb
思想:comb和host相同时,根据host_rank的数值加权
思想:在comb的长度\\stopwords的比例满足条件的情况下,根据comb和title的匹配度matched_ratio进行调权
明确寻址意图的query:all_navi_token
matched_ratio_in_comb=0.8&&matched_ratio_in_titlemax_matched_ratio
doc的host_id是否在host_map中
有明确寻址需求的query:
InitDocInternal()
加权系数:kNaviFactor = 1.3
max_matched_ratio 0.3
5
0 条评论
回复 删除
下一页