文本数据算法处理流程
2021-05-07 09:24:20 4 举报
多数据源的文本数据算法处理流程
作者其他创作
大纲/内容
数据源3
词频特征
数据清洗
文本消歧
重复数据处理
主题特征
算法模型
关系抽取
预处完成数据
N-Gram
文本分词
去停用词
结构化数据库
数据源2
命名实体识别
语法特征
数据转换
词性特征
事件抽取
文本替换
属性抽取
转换(图片、语音)
数据粒度转换
文本数据
文本预处理
文本还原
聚合转换
缺失值清洗
特征提取
错误数据处理
数据类型转换
数据源1
非需求数据清洗
0 条评论
下一页