dama 12-14
2022-11-17 18:41:13 0 举报
AI智能生成
dama
作者其他创作
大纲/内容
第十二章:元数据管理
理解元数据管理意义
了解元数据的10点作用,管理不善导致的5个问题
元数据的10点作用
元数据管理不善导致的5个问题
理解元数据管理的5大目标和8个原则
5大目标
8大原则
理解元数据的基本概念、3种类型
基本概念
3种类型
理解元数据的元数据架构类型
集中式元数据架构
分布式元数据架构
混合式元数据架构
双向元数据架构
了解元数据战略
了解元数据需求
了解元数据架构定义过程
1)创建元模型
2)应用元数据标准
3)管理元数据存储
了解管理元数据的工具:元数据存储库
理解缺乏高质量元数据的 3 点影响
理解数据血缘的概念
理解元数据治理的过程
理解元数据治理的标准
理解元数据治理的度量指标
1)元数据存储库完整性
2)元数据管理成熟度
3)专职人员配备
4)元数据使用情况
5)业务术语活动
6)主数据服务数据遵从性
7)元数据文档质量
8)元数据存储库可用性
第十三章:数据质量
了解使用低质量数据的风险
理解数据质量管理的3大目标
理解数据质量管理的10大原则
了解常用描述数据质量的维度
了解数据质量改进的生命周期
理解元数据与数据质量的关系
1. 元数据对于管理数据质量至关重要
2. 管理良好的元数据还可以支持改进数据质量的工作
理解数据质量问题的常见原因
1.缺乏领导力导致的问题
2. 数据输入过程引起的问题
3. 数据处理功能引起的问题
4. 系统设计引起的问题
5. 解决问题引起的问题
理解改进数据质量的4种数据处理方法
1. 数据清理
2. 数据增强
3. 数据分析和格式化
4. 数据转换与标准化
理解数据质量管理的7个关键活动
定义高质量数据
定义数据质量战略
识别关键数据和业务规则
执行初始数据质量评估
识别改进方向并确定优先排序
定义数据质量改进目标
开发和部署数据质量操作
理解如何定义高数据质量
评估组织对数据质量改进的准备情况
了解组织中数据质量的当前状态
了解数据质量的重要工具
理解数据质量管理的6个方法
预防措施
纠正措施
质量检查和审核代码模块
有效的数据质量指标
统计过程控制
根本原因分析
了解如何实施数据质量改进工作
理解数据质量工作与数据治理的关系
数据质量工作作为数据治理计划的组成部分时,效果更好
治理组织可以通过以下方式加快数据质量方案的工作
第十四章:大数据与数据科学
理解数据科学的定义和过程
1. 定义
2. 过程
理解大数据的六个特征(6V)
数据量大(Volume)
数据更新快(Velocity)
数据类型多样/可变(Variety/Variability)
数据黏度大(Viscosity)
数据波动性大(Volatility)
数据准确性低(Veracity)
理解大数据的来源
理解数据湖的概念
理解机器学习的概念
理解语义分析的概念
理解数据和文本挖掘的概念
数据挖掘(Data mining)
文本挖掘
理解预测分析的概念
理解运营分析的概念
理解数据可视化的概念
理解使用大数据的关键活动和过程
1.定义大数据战略和业务需求
2.选择数据源
3.获得和接收数据源
4.制定数据假设和方法。
5.集成和调整数据进行分析。
6.使用模型探索数据
7.部署和监控
了解大数据科学相关工具和技术
1.MPP无共享技术和架构
2.基于分布式文件的数据库
3.数据库内算法
4.大数据云解决方案
5.统计计算和图形语言
6.数据可视化工具集
理解大数据战略的实时指南
1.战略一致性
2.就绪评估/风险评估
3.组织与文化变迁
了解大数据治理的5个目标
了解大数据治理的治理要点
0 条评论
下一页