PageRank
2016-12-26 15:34:46 0 举报
PageRank是一种由Google创始人拉里·佩奇和谢尔盖·布林于1998年提出的链接分析算法,旨在衡量网页的重要性。它基于“从许多优质网页获得超链接的网页,必定也很重要”的概念。PageRank通过将每个网页的链接数量和质量作为评估依据,计算出一个0到10之间的分数,用于确定其在搜索结果中的排名。该算法的核心思想是,具有更多高质量外部链接的网页更具权威性和可信度。PageRank不仅在搜索引擎中广泛应用,还对网络营销、网站管理和学术界产生了深远影响。
作者其他创作
大纲/内容
Y
end
t=1
marix[i][t]=1
crawl the first 100 pages from \"http://www.jnu.edu.cn\"
N
read the web1.txt line by line
printf the matrix
write the urls into the text:web1.txt
t++
write the urls into text:web.text
the text is end?
begin
i++crawl the pages from the current line
equal?
t=n?
use the database to do duplicate checking
create a 100*100 identity matrix
compare the urls between the two texts
0 条评论
下一页