第三类克隆检测流程
2017-04-15 21:44:06 2 举报
第三类克隆检测流程
作者其他创作
大纲/内容
通过读取part-r-00000文件,对相似文件再次计算所有的Chunk
Winnow算法提取有效文件的特征值
mapreduce并行计算每个待检测文件和HBase中相似特征值的个数
reduce程序将特征值相似率超过50%的待检测文件和克隆文件保存到part-r-00000
上传待检测项目
标记相同的Chunk,合并成克隆代码片段
0 条评论
下一页