数据标准梳理工作清单
2024-03-19 19:45:09 0 举报
AI智能生成
数据标准梳理工作清单
作者其他创作
大纲/内容
元数据类
数据表标准
基本属性
标准代码
示例:table001(需要规则)
标准名称
示例:ODS层XX业务系统来源表规范
标准集
示例:ODS层表规范
依据标准
示例:《数仓分层规范》
技术属性
表名称
示例:table1
表注释
示例:用户表
同步类型
示例:批量同步
批量同步
实时同步
存储类型
示例: hive
存储格式
示例:textfile
存储路径
示例:/root/xxsystem/table1
业务属性
表中文名称
示例:用户表
表业务含义
示例:系统用户维护主表
表系统来源
示例:XX业务系统
来源表类型
事实表(Fact Table)
用来存储业务事实数据,通常包含各种度量值,比如销售额、数量、金额等。事实表通常与维度表进行关联,用来支持数据分析和报表生成等业务需求。
维度表(Dimension Table)
用来描述事实表中的数据,提供上下文信息。比如,产品维度表可以包含产品的名称、类别、品牌等信息,时间维度表可以包含日期、年份、季度等时间相关信息。
参照表(Lookup Table)
用来存储固定的参照数据,比如国家代码、省市区信息等。参照表通常被其他表引用,用来确保数据的准确性和一致性。
代码表(Code Table)
用来存储代码值与对应的含义,比如状态码表、类型码表等。代码表可以帮助对数据进行分类和理解。
映射表(Mapping Table)
用来建立不同数据元素之间的映射关系,比如产品与分类的映射关系表、员工与部门的映射关系表等。
历史表(History Table)
用来存储数据变更的历史记录,比如订单状态的变更记录、客户信息的变更记录等。历史表可以帮助跟踪数据的变化历史。
其他表(Other Table)
业务域
示例:医疗行业
一级主题
示例:就诊主题
二级主题
示例:患者主体
三级主题
示例:挂号环节、就诊环节、开药环节、缴费环节
管理属性
数据来源单位
示例:XXX医院
归口管理单位
示例:XXX医共体
数据实施单位
示例:coop
资产属性
资产分层路径:
示例1:ODS/XX业务系统
示例2:DWD/医疗行业/就诊主题/患者主体/挂号环节
资产表命名规范
示例1:ODS_XxSys_*
示例2:DWD_YL_JZ_HZ_GH_*
安全属性
是否允许预览数据
示例:是
是否允许提供服务
示例:是
服务传输加密算法
示例:AES
数据项标准
基本属性
标准代码
示例:Col001(需要规则)
标准名称
艾滋病患者标志
标准集
示例:就诊主题患者
依据标准
示例:《WST 363.11—2023卫生健康信息数据元目录第11部分:医学评估》
技术属性
字段名称
azb
字段类型
布尔型(boolean)
字段长度
双精度长度
字段备注
业务属性
数据元标识符
例如:DE05.10.003.00
数据元名称
例如:艾滋病患者标志
定义
例如:标识患者是否已经发展成为艾滋病患者
主题分类
大类
小类
数据元值的数据类型
例如:L
表示格式
例如:T/F
数据元允许值
—(急性,慢性等枚举)
管理属性
版 本
V 1.1
注册机构
国家卫生健康委员会卫生健康信息标准专业委员会
相关环境
卫生健康信息
分类模式
分类法
主管机构
国家卫生健康委统计信息中心
注册状态
标准状态
提交机构
国家卫生健康委统计信息中心
质量属性
不允许为空
是/否
需要保持唯一
是/否
长度规范
50
条目规范
{ref}<50
数字范围
{ref}>10 and {ref}<1000
日期范围
{ref}>{lastMonth-lastDay} and {ref}<{thisMonth-lastDay}
枚举范围
{ref} in ('已筛查','未筛查','不详')
代码字典
疫苗名称代码
字符规范
电话号码正则表达式
安全属性
安全级别
绝密/保密/秘密/公开
是否脱敏
是
脱敏规则
第一个字符*替换
文档类
数仓基本规范
数仓分层规范
业务域,主题,业务主体,业务环节梳理/梳理办法
...
数仓实施规范
建表规范
ETL规范
T+1
全量
增量
实时
...
国标文档规范
客户定制规范
字典类
字典梳理录入
词根梳理录入
0 条评论
下一页