命名实体识别 | BiLSTM+CRF模型架构图
2023-06-12 20:02:00 3 举报
自然语言处理——基于BiLSTM和CRF的文本关键词抽取技术(命名实体识别)
作者其他创作
大纲/内容
线性 CRF
0、数据处理:数据读取 → 转换数据形式 (每条样本包含文本序列和标签序列 => 分词 => 将每个字词映射为相应的词典id) → 组装 mini-batch(构造 DataLoader)
4、接下来,各个位置的发射分数将传给 CRF(CRF 层的作用:学习标签间的约束)
X4
Linear
BiLSTM Layer
....
Embeding Layer
I-Person
O
1、首先获取了文本串中的每个字词的词向量
B-Person
Linear Layer
X3
X0
e1
X2
Tag Sequence
BiLSTM+CRF 模型架构图
e2
2、然后将其传入 BiLSTM 中获得了相应的上下文向量
CRF Layer
e3
3、接下来继续将每个位置 BiLSTM 输出的上下文向量传入线性层获得相应的发射分数
e4
...
X1
模型中每层的含义(自下而上看)
Input Layer
e0
0 条评论
下一页