文本处理流程图
2017-01-07 23:28:49 0 举报
生物医学文献蛋白质关系分析系统流程图
作者其他创作
大纲/内容
包含两个蛋白质实体的句子
通过<蛋白质1,蛋白质2>形式的表格在网页上显示
使用Apache Tika 开源的工具包
语料
(4)实体识别
a.分句(Abner)b.实体识别(Abner)c.筛选句子
a.英文分词b.词根还原c.词性标注使用openNLP工具
(3)预处理
(5)显示
列表
(1)格式转换
a. 使用libSVM来训练分类器b. 用训练好的分类器预测
(2)实体识别
系统根据关键词利用爬虫技术爬取文本
用户上传文本
蛋白质间关系
文本单元
0 条评论
回复 删除
下一页