毕业设计技术路线图
2021-10-19 13:30:10 0 举报
图像预处理、文字识别API、Word2Vec词向量化模型、句向量化、文本相似度计算、操作系统课程自动评分模型,数据集收集与处理,系统功能模块划分
作者其他创作
大纲/内容
操作系统课程评分模型
句向量化
通过OCR获取《现代操作系统》教材的所有文本,获得操作系统课程领域语料
获取考生答案文本
图像预处理
差错反馈模块
数据集收集与处理
学生信息管理模块
获得学生答案的句向量
学生答案词序列与标准答案词序列
计算以向量余弦距离衡量的文本相似度
获取学号
评分模型评分流程
词向量化模型
获得标准答案的句向量
操作系统答题纸图像数据集
灰度化
学号区域
去噪
调用文字识别API
获得学生答案词序列的词向量序列
各简答题区域
图像预处理模块
计算学生成绩
提供试题,线下招募志愿者,使其在空白纸张上书写作答信息,再通过手机拍照进行电子化
学生信息管理
文本相似度计算及评分模块
成绩信息管理模块
自动阅卷模块
使用WikiExtractor、OpenCC等工具进行数据清洗
提供标准答案文本
根据题目分值与文本相似度的值,按照一定的映射关系,进行误差修正后给出该题得分
成绩分析模块
使用OpenCV库进行图像预处理
Word2Vec词向量化模型训练语料
成绩信息管理
使用jieba分词工具对上述领域语料进行分词,再人工校正分词结果,获得操作系统课程词典
二值化
启用操作系统课程词典,使用分词工具进行分词
答题纸文字识别API模块
透视变换
操作系统课程自动阅卷系统功能模块
获取标准答案文本词序列
答题纸图像
获取学生答案文本词序列
根据标准答案批改选择题
使用jieba分词工具,以操作系统课程词典为自定义词典,对清洗后的中文维基百科进行分词,获得Word2Vec词向量化模型训练语料
区域分割
选择题区域
获取各选择题题号及答案
操作系统课程领域语料与操作系统课程词典
在中文维基百科官方仓库网站中下载最新的中文维基百科压缩包
0 条评论
下一页