瑞金糖尿病数据命名实体识别项目思维导图
2022-06-17 10:48:01 0 举报
AI智能生成
瑞金糖尿病命名实体识别比赛项目实现思维导图
作者其他创作
大纲/内容
数据处理
通过ann文件,得到实体标签
o
Test
Disease
Anatomy
Drug
Test_Value
Symptom
Reason
Level
Amount
Treatment
Duration
Method
SideEff
Operation
Frequency
切分数据文本
排序、去重
拆分长句子
拆分短句子
匹配 标签符号、前后文本
匹配关键词、连接词,进行分割
匹配序号
数据集划分
文本读取,获取标注文件中的标签(label)
写入新标签,B I 实体类别
获取词边界特征(bound)
提取词性(flag)
获取拼音特征(pinyin)
获取偏旁部首特征(radical)
映射字典
读取文本数据,生成BIO文件
生成标注信息的三元组
词向量Word2vec
Seq2Seq模型搭建
Bi-LSTM+CRF 序列标注
0 条评论
下一页