pagerank
2015-08-30 15:00:51 1 举报
pagerank MapReduce实现
作者其他创作
大纲/内容
A B C DB A DC CD B C
A 0.0A 0.125B 0.083333B 0.0B 0.125C 0.083333C 0.25C 0.0C 0.125D 0.083333
A a 0.25B a 0.25C a 0.25D a 0.25
A B C DA a 0.25B A DB a 0.25C CC a 0.25D B CD a 0.25
A a 0.15B a 0.2167C a 0.4167D a 0.2166
Reduce
Map
第二次Reduce:对所有相同的网页值进行累加,如A:P(A)=a*(0+0.125)+(1-a)*0.25=0.8*0.125+0.2*0.25=0.15其中a为权重,此处取0.8
新一轮概率分布向量
V初始概率分布向量
links.txt链接关系
第一次Map-Reduce:对链接关系与分布向量按网页id排序
0 条评论
下一页