POI 判重
2023-07-21 16:13:14 0 举报
地图坐标点判重
作者其他创作
大纲/内容
融合
场所分店词
行业副体词
行业衍生词场所分店词行业副体词行政区划词无关紧要词主体关键词
行政区 hash
检查是否包含垃圾字符串
主 hash == 1
场 hash = 0.95
开始
n场 == NULLpn场 == NULL
否
300米范围内 n
hash *= 1.2
行业衍生词
都不为空
是
都为空
衍 hash
新增
pn衍
结束
副 hash = 相似度乘积 * 0.8
n场
pn1pn2主体关键词
name 检查
n1n2主体关键词
分词
查找相似度
n场 pn场 每个字符比较
pn副
场 hash = 1
pn主 = n主
n2 pn2 : 汉字,自渎,数字,最右边的一对小括号
完全相等
场 hash d = 150米 = 1 150 d 200 = 0.9 200 d = 0.8
pn副 数量=n副数量
n衍 == NULLpn衍 == NULL
n1 = pn1 ?
剩余特殊字符处理
有一个为空
衍 hash =0.8
副 hash 》0
判断距离
n1 pn1 :汉字,字母和数字
所有hash值相乘
只要有一个相等
查找附近的POI
n衍
特定字符附件
行政区划词
副 hash
pn主 == NULLn主 == NULL
hash 1
副 hash = 相似度乘积
同 行业副体词
特定字符替换
hash 0
pn副 == NULLn副 == NULL
衍 hash = 1
副 hash = 1
hash = 0.75
副 hash = 0.8
主题关键词
POI - 判重
场 hash d = 150米? 1 : 0
pn场
主 hash = 1
获取 POI NAME
n副
0 条评论
下一页