NLP关键词提取
2019-11-12 14:04:02 0 举报
文本分析
作者其他创作
大纲/内容
http://www.hankcs.com/program/algorithm/aho-corasick-double-array-trie.html
文本分析-关键词提取
分词权重计算
分词结果
类目树核心词汇权重
词性筛选
http://www.hankcs.com/nlp/segment/n-shortest-path-to-the-java-implementation-and-application-segmentation.html
根据分类策略合并到类目书中
核心词汇
N最短路径
搜狗等输入法词库
wiki / A+ 文档
歧义词替换
参考关联词汇
治疗方法
词汇筛选
词典
人工词汇映射
合并词典词汇
标注词性
http://www.hankcs.com/nlp/segment/crf-segmentation-of-the-pure-java-implementation.html
聚类算法
自定义词汇
疾病指标
症状
不同行业交叉降权
分类、分层降权
筛选行业词汇
核心词典
停止词
行业专业词汇
标准算法-生成词图
http://www.hankcs.com/nlp/segment/the-word-graph-is-generated.html
HMM模型(BEMS)
类目树
专业网站超链接词汇
权重相乘
viterbi算法
分词算法
标题词汇权重
CRF分词(JieBa)
http://www.hankcs.com/nlp/part-of-speech-tagging.html#h2-8
TextRank算法计算词汇权重
关联从属词汇
TF-IDF算法计算逆词频
输出权重较高的词汇
人工审核类目、去除降低无效词汇权重
学术研究
药品
疾病
分词器分词
医疗器械
0 条评论
下一页