摘要分类流程图
2019-01-28 14:48:45 0 举报
无监督文本分类原理图
作者其他创作
大纲/内容
向量化分类词库
文本处理基本流程
无意义词剔除
年龄分布
分词处理
多维度交叉验证
词文本
文本向量化处理
摘要拼接长文本
固定搭配词库
公司名特征
计算余弦相似度
相似词去重
参数调优
构建停用词库
互信息+高频词构建词库
未分类文本
Gensim模糊匹配
文本特征工程
机器学习建模分类
向量化词库
对文本中的词加和求平均
成功分类文本
业务经验
高频词
固定搭配语料库
提炼搭配
摘要文本
结合其他维度分析
计算词库中每个词对应的向量
互信息法提取固定搭配
不含中文类文本
剔除无效信息
摘要语料库
停用词过滤
合并去重
可反复迭代
词频排序
摘要分类检验
分类词库
关键词向量化
提炼词库
未成功聚类文本
模糊匹配找出新关键词
原始分类词库
金额分布
Word2Vec模型
成功聚类文本
生成训练集
生命周期
找出词语对应的向量
文本建模+特征提取
含中文类文本
拆词合并
模糊匹配迭代词库
根据文本内容分类
向量化摘要文本库
目标文本
已分类文本
迭代更新词库
DBSCAN聚类分析
收藏
收藏
0 条评论
下一页