SimHash.C643
2016-01-20 10:41:04 2 举报
SimHash.C643是一种局部敏感哈希(Locality Sensitive Hashing,简称LSH)算法,主要用于解决数据相似性检索问题。它通过将高维特征空间中的数据映射到一个低维的二进制哈希空间,使得相似的数据在哈希空间中具有较高的概率相互接近。C643表示使用64位的汉明距离作为相似度度量标准,即只有当两个数据的哈希值相差不超过64位时,它们才被认为是相似的。SimHash.C643具有较高的查询效率和较低的误报率,广泛应用于文本相似性检索、图像相似性检索等领域。