输入法词库增量更新前处理流程
2016-08-31 10:16:13 0 举报
输入法在词库更新方面流程
作者其他创作
大纲/内容
本地增量更新
好戏即将开始
1.选取符合添加到核心词库的词语2.与日常记录的词语汇总3.从行政获取新员工名单4.修改文件格式为UCS-2 Little Endian5.完成后查看工具日志确定更新情况
每周四完成增量更新后,及时更新188上云词库核心词库和云词库目录:\\\\172.16.0.188\\guoling提取其中的新词热词处理后文件
diff包打包生成
将获取的各类包和包的md5值备份一份,同时将SVN信息同步更新
准备测试环境测试上线
注音处理
将新词热词复制到处理母表中,执行宏的命令,获取词长结果
拼音比对
将符合要求的2-13词长词语汇总使用KT软件进行注音工作
不要慌
词长处理
新热词获取
增量更新
从郭灵处获取升级规则,选取对应full与diff包进行diff包生成
语言模型验证
将KT注音的结果和新热词注音比对,纠正错误注音,对出现较多的错误注音提醒开发进行更改
0:使用纠正后的读音结果在用搜狗验证1:使用2345InputTools工具进行王牌输入验证2:获取验证结果填入新热词处理母表3:执行宏的命令4:获取匹配结果情况
备份
收藏
收藏
0 条评论
回复 删除
下一页