摘要自动抽取流程
2018-08-19 18:01:57 8 举报
自动摘要抽取流程通常包括以下几个步骤:首先,对原始文本进行预处理,包括去除停用词、标点符号等;然后,使用关键词提取算法识别出文本中的关键信息;接下来,根据关键信息构建候选摘要集合;之后,采用基于图模型或基于排序的方法对候选摘要进行评估和排序,选择最优的摘要;最后,将最优摘要输出给用户。整个过程可以自动化地完成,大大提高了处理大量文本数据的效率。
作者其他创作
大纲/内容
计算摘要
词
否
在领域词库中匹配词
词对应的权重值
句子相似度权重值
输出
词频统计
输入
句子在文中位置的得分项权重
使用中文分词算法
文章摘要信息
句子对应的位置
基于词权重的句子词权重值
计算句子的位置权重值
增加该词的权重值
正文
降低该词的权重值
句子相似度得分项权重
词库中词的权重值比本次计算得到的权重值大?
文本文档、Office系列文档、PDF文档等
基于词权重的句子权重得分项项权重值
优化后词的权重值
领域词库
句子权重值
句子
非结构数据
摘要信息取权重的比例
对正文使用断句算法
计算句子及对应的位置
句子的位置权重值
提取数据正文
是
根据领域模板中的权重分配计算句子权重
领域模板
计算基于词权重的句子词权重值
文章中不同位置权重值设置
使用相似度算法
匹配到对应词?
0 条评论
下一页