大数据平台数据治理流程
2022-09-22 11:59:33 2 举报
大数据医疗数据治理数据流架构图
作者其他创作
大纲/内容
Mongodb集群
原始库
术语审校
ETL
数据接口
安全管理规范
Kafka
模板归纳
Hadoop集群
···
OMOP模型
Redis集群
全字段去重
数据采集、交互
Flume
术语映射
数据转换
标准操作规范
数据计算
数据存储
数据应用层(ADS)
数据质检
Oracle集群
数据统一
Scala
基础设施层
开放平台
Sqoop
专病库模型
专病资源库
备份任务还原(backup文件)
非结构化模型
结果评价
HDFS
信息提取
标准字典映射
MQ消息集群
Spark/Flink
CDSS
数据加载
规则构建
随访
分词预处理
LIS
构建模型
镜像库
关系映射
PIS
数据映射
数据层
日志接收/脱敏/发送kf(ogg/mirror接收)
MDT
PACS
手工处理导(Dbflie)
确定患者索引
OMOP资源库
Hbase
标准化
关联映射
数据传输
MySQL集群
人工标注
第三方应用
RWS
结构化模型
NLP
ElasticSearch集群
数据抽取
数据采集
全局查询检索
文件拆分
统一数据类型
数据解析
自检修正
EMR
文本预处理
科研
映射规范
院内CDR及第三方接口
数据资源目录
数据统计分析
Kylin
数据清洗
HIS
Kettle取/webService(jdbc接口)
CDM资源库
机器学习
数据源
医学质检
Hive/Presto
ODS镜像层
大数据平台
0 条评论
下一页