textrank流程图
2016-12-30 05:01:48 0 举报
TextRank是一种基于图的排序算法,用于提取文本中的关键词或短语。其流程图如下: 1. 构建词汇图:将文本中的单词作为节点,根据它们之间的共现关系(如相邻、同义词等)构建边。 2. 初始化节点得分:为每个节点分配一个初始得分,通常为1。 3. 迭代更新节点得分:在图中进行随机游走,每次从当前节点出发,遍历其邻居节点,并根据邻居节点的得分和边的权重更新当前节点得分。重复此过程多次,直到收敛。 4. 选择关键节点:根据节点得分,选择得分最高的节点作为关键词或短语。
作者其他创作
大纲/内容
从w1开始,窗体1取K个节点
计算各节点的重要性
由关键词获得关键短语
迭代,选出重要性最高的节点
从w2开始,窗体2取K个节点
创建窗体K,依次遍历统计创建各个节点之间的边
python jieba进行分词
结束
摘要生成
开始
循环,获取所有的边
提取出最重要节点对应的词,作为关键词
创建窗体K
0 条评论
下一页