直播平台需求
2017-05-17 10:43:34 0 举报
1
作者其他创作
大纲/内容
3
使用TF-IDF算法提取一些权重较大的关键词,这个算法的具体实现“结巴”分词已经给出,只需调用即可
对分类的结果使用ajax的回调函数来返回到前台的页面中
使用爬虫爬取一些网站上的招标信息,并人工将这些找遍文件进行分类
设计及实现
1
使用文本算法根据提取出的关键词向量分析出结果
使用“结巴分词”将用户输入的信息断句,并将结果储存在数组里面,供后面的程序调用
4
结果展示
中文分词
实现顺序
采集一些招标样本,为后面的分类算法做准备
6
需求
2
特征提取
5
将分析出得到的结果展示在前台的web页面上
用户可以用多种方式输入招标信息
信息输入
基于自然理解的招投标系统
样本训练
文本分类
可以将文本分成一个一个的词汇
使用朴素贝叶斯分类算法对提取出的关键词向量进行文本分类
模块
提取分词结果中有效的关键词
文本
0 条评论
下一页