先知书本录入
2017-04-18 11:45:45 0 举报
先知书本录入是一项繁琐但至关重要的任务,它涉及到将古老的、珍贵的信息从一种形式转化为另一种形式。这项工作需要极高的专注力和精确度,因为任何错误都可能导致信息的丢失或误解。录入员需要对古代文字有深入的理解,以便准确地解读和转录文本。他们还需要熟悉各种录入软件和技术,以确保数据的安全性和可访问性。尽管这项工作可能看起来枯燥乏味,但它实际上是在保护和传承我们的文化遗产,让未来的世代也能接触到这些宝贵的知识。
作者其他创作
大纲/内容
matrix-book脚本
如果本页题目框选完毕点击领取新任务
如果是新任务框选:book_section.status = 31如果是框选质检打回:book_section.status = 32 分配给原质检员
将扫描好的书本图片按照规范放入nfs文件夹
目录质检阶段(目录质检人员)
结构化数据持久化
质检通过
matrix-book
自动领取任务
1 变更书本状态 book.status=1002 更新任务状态 is_finished=Y3 更新群组计数4 将要推送的任务放入online_record
自动领取任务(默认1个)
此题是否在去重||录入||录入质检环节打回
否
题目质检阶段(题目质检人员)
变更状态 item.status=110
去重打回
是否框选和录入错误
状态不变
继续框选
持久化数据
ocr识别阶段(脚本定时)
是否录入错误
每分钟轮询 检查当前书页的ocr识别情况
领取新任务
每分钟轮询推送队列表online_record
是
book_tree
先知书本录入
题目录入打回
item.status=30item_border.is_error=Y
录入质检通过
保存题目
使用ftp工具创建bookid文件夹并上传所有图片
点击领取新任务
脚本 --task=cron --action=updateItemOcrStatus
子流程:1 保存题目信息2 if (录入错误数据 || 框选和录入错误) { 分配给原质检员 变更状态: item.status=90} else { 题目状态变更: item.status=80}
题目去重阶段(书本去重人员)
领取新任务(默认1个)
书本制作阶段(书本制作人员)
打回的原负责人还在当前群组则:book_section.status=50否则book_section.status=20
matix
book.status=80
点击通过
book.status=60
题目录入阶段(书本题目录入人员)
图片框选(书本框选人员)
变更状态 item.status=100
脚本 --task=worker --action=ocr4Book
matrix持久化
刷新图片顺序
是否框选错误
填写规范:http://106.75.72.189:8080/doc/index.html
任务管理员进入分配任务页面
item.status=11
上传书籍的TXT文本
结束
book.status=0
book.status=30book_section.status=20||40
book.status=40
子流程:1 保存题目信息2 if (质检打回框选和录入错误) { 分配给原质检员 题目状态变更: item.status=100} else { 变更状态: item.status=40}
目录录入阶段(书本录入人员)
框选质检打回
无误则点击领取新任务
选择群组并分配
检查目录并保存
变更状态book_section.status=40
检查是否ocr识别有误并进行更正保存
每分钟轮询 进行ocr题目识别
每分钟轮询书本是否全部录入完成
book.status=20
变更状态book_section.status=40item.status=0
上传所有书本图片
保存框选结果
质检是否通过
题目质检打回框选和录入错误
打回
脚本 --task=worker --action=updateOverStatus
book.status=90
书本任务分配阶段(任务分配管理员)
录入完毕状态变更(脚本自动)
下一个任务
推送到matrix(脚本自动)
脚本 --task=matrix --action=book
将已经框选完成的书页下所有已经被框选的并且经过ocr识别过的题目的状态 进行变更
保存框选结果此题跳过质检
框选题目信息存入item
是否重复
图片框选质检(书本框选质检人员)
book.status=10book_section.status=0
开始
push
item推送到kafka
自动领取任务(默认10个)
题目质检打回框选错误
0 条评论
回复 删除
下一页