超大规模知识图谱工程项目建设步骤与指南·研发实施标准流程
2022-04-22 11:01:12 2 举报
超大规模知识图谱工程建设标准流程
作者其他创作
大纲/内容
产品工程
未通过
产品功能、信息设计
数据/计算/特征工程
产品需求文档、产品原型图
本体评价
本体模型
生产环境正式部署
投入实际使用
通过
数据挖掘、分析算法API
客户二次验收
数据精细调研
- 数据量统计- 数据增量统计- 数据体积统计- 数据质量统计(非空、重复、主键唯一等)
PM、算法、数仓工程师
项目结束
数据ETL算法设计与修改
- 边权重算法- 边概率算法- 推理关系规则和算法设计- 实体链接(抽取、消歧、对齐、融合)- 关系抽取(抽取、消歧、对齐、融合)...........................................................- 字典、词典和模板准备- 语料及语料标注- 人工复检优化
是
满足需求
符合
开发环境与前后端研发
微调
测试环境评测
数据挖掘与模型工程
客户、测试、前后端工程师
数据初调研
需求方案
不通过
否
与客户、需求方保持密切沟通
ETL需求评审
反馈调优
需求和方案二次评估
产品功能需求捕获
不符合需求规划
产品评审
可行性评估
本体迭代修改
产品文档(开发版)保真产品原型
产品交互流程设计
需求、方案定义(主题工程1)
数据调研(主题工程2)
客户、PM、架构师
初步论证
可视化布局算法、其他功能应用算法
不
交付工程
与客户密切沟通
测试通过
功能联调联试
需求方案2.0版本
服务器搭建、网络与软件搭建
项目开始
KG预览与测试
数据ETL工程
产品方案客户二次确认
知识图谱工程项目建设步骤与指南暨研发实施标准流程V1.0
需求收集
客户、PM、前后端工程师
客户参与
数据存储(图引擎等)
客户验收试用体验
测试环境部署
系统架构方案
数据ETL需求文档
- 节点和关系定义(需客户参与)- 关系权重定义(需客户参与)- 关系可信度定义(需客户参与)- 抽取优先级定义
技术架构评估
未满足需求
数据精细调研报告与数据与项目实施可支持度评估
收藏
收藏
0 条评论
下一页