数据资产管理实践
2024-04-07 11:31:13 29 举报
AI智能生成
数据资产管理实践思维导图
作者其他创作
大纲/内容
一、基础概念梳理
数据:记录事实和数字信息的集合,可以是任何类型的信息,例如文本、图像、音频等。
数据资产:由企业或组织拥有或控制的,能够为组织带来经济利益的数据资源。
数据管理:收集、存储、保护和使用组织数据的一系列流程。其目的是在整个数据生命周期内交付、控制、保护、输出数据,并因此提升数据的价值。
数据资产管理:对企业或组织中的数据资产进行管理和维护的一系列活动和过程,包括进行分类、标识、存储、备份、恢复、保护、共享、清理和销毁等。
数据治理:组织中涉及数据使用的一整套管理体系,包括组织、制度、流程、工具。最终目标是提升数据的价值,即资产属性。
数据中台:一套数据集成、管理、应用的体系。本质目的在于通过一系列的整合与管理,提供可以复用的数据能力,提升企业数据资产化能力,从而更好的为业务提供数据支撑,实现数据驱动的目标。
二、思维惯性转变
是管理不是治理
关系
数据治理是数据资产化的必要手段,数据资产管理的开展以数据资产为基础。
羁绊
数据治理的过程需要贯穿整个数据生命周期,这其中也包含数据资产管理。
并且数据治理与数据资产管理也存在开展手段的重叠例如:元数据、数据血缘、数据质量等,所以这也是这两者经常被混淆的原因之一。
并且数据治理与数据资产管理也存在开展手段的重叠例如:元数据、数据血缘、数据质量等,所以这也是这两者经常被混淆的原因之一。
区别
驱动数据资产管理推进的是效益,过程重组织与协调,作用于数据加工、应用与交易关节,最终目标是价值最大化。
驱动数据治理推进的是混乱,过程重政策与执行,作用于数据生产消费全流程环节,最终目标是减少资源浪费,提升流程效率。
现状
数据治理
门槛低:可能很多人就要反驳我了,数据治理不是需要自上而下、政策驱动吗,为什么还说门槛低呢。那是因为仅从数据开发的角度来说,哪怕你只是对数据进行了 if id !=null 的判断,其实你就已经做了数据治理的工作了。
追逐潮流:别人都在治,我不治,是不是不太好。从业这几年,越来越感觉国内的技术理念存在很强的从众效应,实时数仓如此、云原生如此、数据治理也是如此。确实有技术理念先进的原因,但是为了数据治理而治理数据的事也时有发生。
刚需:来自上游的锅估计每个数据从业者都背过,数据治理是数据部门有效规避数据问题的重要手段。数据规范约定、去重、缺失项删除、格式转换等也都是数据部门的常规工作。数据治理是数据生产消费必不可少的刚需环节,无非是不同公司投入的资源多少而已。
数据资产管理
数据资产管理一定是重点发展的趋势,在数据资产化、数据要素化、数据入表、数据交易、国家数据局等国家顶层制度设计下,数据的价值一定会被逐渐方法。数据资产管理一定也会随之跟进。
是资产不是数据
资产属性
可交易性:数据资产可以被买卖、出租或授权使用,类似于传统资产的交易行为。
经济价值:数据资产具有经济价值,可以为组织或个人带来利益。
价值波动:数据资产的价值易发生变化,且随应用场景、用户数量、使用频率等的变化而变化。
产权属性:使用权、加工权、经营权等资产产权。
三、资产评估思路
《资产评估专家指引第9号——数据资产评估》
数据库管理系统中的数据库;
用于支持业务应用的软件系统中的数据;
用于支持业务流程和决策的数据;
用于支持研究和开发活动的数据;
其他类型的数据资源;
作者思路
业务数据:数据库管理系统中的数据库、用于支持研究和开发活动的数据。
数仓数据/BI报表数据:用于支持业务流程和决策的数据。
交易数据:企业用于对外交易的数据,上架到数据交易所的数据。
四、要不要管
数据资产管理是需要投入较多公司资源开展的一项长期工作,且短期内无法给公司带来实际收益。
直接因素
现在公司的数据生产与使用是否混乱。必要不唯一条件
混乱的数据是否导致了开发、生产、运营等效率的底下。必要不唯一条件
到底是要做数据资产管理还是要做数据治理,一定要想清楚。非必要唯一条件
公司是否有数据能够上架到数据交易所开展交易。必要唯一条件
间接条件
目前数据团队的数据开发工作是否饱和,数据链路(是数据链路而不是数据质量)是否趋于稳定,是否能够投入一定的人力开展数据资产管理工作。
公司领导是否认可数据资产管理理念,数据团队是否有信心说服领导投入资源。
团队有无数据资产管理经验,是否需要在摸索中前进,是否能够承担试错成本。
作者建议
数据团队本就是成本团队,数据资产管理收益又存在一定的量化苦难与滞后性,所以大家在开展此工作之前一定要考虑清楚~
五、管理内容
元数据 ☆☆☆☆☆
不管做数据资产管理还是数据治理还是数据管理,元数据都是必要内容。
元数据是实现数据资产全面有效管理和价值最大化的关键因素。
元数据是实现数据资产全面有效管理和价值最大化的关键因素。
数据质量 ☆☆☆☆☆
数据质量是数据资产管理的重要组成部分,它直接影响到数据资产的价值和利用效果。
资产安全/权限 ☆☆☆☆☆
数据资产的安全和权限管理是保证数据资产管理工作平稳开展的重要支柱。
数据血缘 ☆☆☆☆
数据血缘记录和展示数据的来源、流向、变换等过程。这种关系的完备程度是衡量数据资产管理程度的重要标准。
数据服务 ☆☆☆☆
数据资产是需要为企业带来经济效益的,效益需要通过数据服务进行体现,数据服务是体现经济效益的重要手段。
数据模型 ☆☆☆
数据模型通过定义数据的基本结构,包括基础数据的类型、性质以及关系,帮助组织理解和使用数据。确保数据的准确性、一致性和完整性,以及其易用性和可扩展性。
数据标准 ☆☆☆
数据标准管理是规范数据标准的制定和实施的一系列活动,是数据资产管理的核心活动之一,对于政府和企业提升数据质量、厘清数据构成、打通数据孤岛、加快数据流通、释放数据价值有着至关重要的作用。
数据生命周期 ☆☆☆
数据生命周期管理(Data Life Cycle Management,DLM)是一种基于策略的方法,用于管理信息系统的数据在整个生命周期内的流动:从创建和初始存储,到最终过时被删除,即指某个集合的数据从产生或获取到销毁的过程。
六、管理流程
1. 确定管理对象
进行数据资产评估后确定需要管理的数据资产对象。
2. 确认管理内容与边界
管理边界一定要提前圈定好,数据资产管理本就是繁琐复杂的工作,模糊的管理边界只会拖垮工作效率。
3. 梳理数据资产管理目录
确认好上述内容之后,我们可以先通过表格的形式梳理出一份数据资产管理表格。我这边给出一份大概的表格样式,见上图。
4. 确定管理方式
数据资产管理,没有平台是绝对不行的,那么就有一个横在数据资产管理工作开展面前的大难题就是:自建or开源or采购。
自建
优点
灵活调整、完全贴合业务需求。
缺点
资源投入太大,费时费力。
建议
不是大公司且有非常强烈的数据资产管理需求就别玩儿自建了。
开源
优点
不花钱,上手快。
缺点
功能不能保证100%适配需求,还是得二开,二开成本较高。
使用成本也较高,因为目前数据资产管理或者数据治理界还没有特别流行的开源工具,所以在遇到使用问题的时候,可能没有办法很快速的解决。
使用成本也较高,因为目前数据资产管理或者数据治理界还没有特别流行的开源工具,所以在遇到使用问题的时候,可能没有办法很快速的解决。
建议
中小公司进行内部数据资产管理的最佳选择,虽然很多开源工具不能100%符合公司的需求,但是先跑起来再优化。
开源工具推荐
Datahub、OpenMetadata、atlas、Metacat、Griffin
采购
优点
定制化方案、定制化开发、定制化服务,只要花钱全是优点~
缺点
花钱
建议
银行、证券、保险、医疗、政企、能源等行业最爱,没钱的话还是用开源吧。
相关企业推荐
亿信华辰、长亮、亚信、美林、数澜、普元、数梦工厂等
5. 纳管
平台建好之后,我们需要将数据资产进行录入纳管,录入方式主要包括三种
自动录入:通过技术手段将技术元数据、血缘、权限等信息进行录入到平台中。
手动录入:针对业务信息、数据标准信息以及补充描述等内容,需要手动录入。
导入:如果之前通过其他方式例如excel等的数据管理信息,可以导入到平台中。
6. 开管
资产录入之后,就可以通过平台开展数据资产管理工作了,包括数据资产的上架下架、信息调整、权限修改、资产检索、质量告警、异常追踪、资产统计等等。
七、考核指标
数据资产率 【错误考核指标】
千万不要用公司数据的资产率考核衡量数据资产管理工作。数据资产化是数据资产管理工作开展的基础,不能用儿子来考核爸爸。
资产资产率指标是用来考核数据治理的,切记。
资产资产率指标是用来考核数据治理的,切记。
资产利用率
数据资产的利用次数:衡量数据资产被使用频繁程度的重要指标,体现了数据的活跃度和价值实现程度。
数据资产的使用范围:主要看数据资产在哪些领域、部门或业务中被应用,评估数据资产的通用性和广泛性。
数据资产的应用场景:不同的应用场景可能会对数据资产的需求和使用效果有不同的影响,因此,考核数据资产在不同场景中的应用情况也是必要的。
数据资产的更新周期:反映了数据的实时性和有效性,是评估数据资产质量的一个重要方面。
纳管覆盖率
当前数据资产纳管的范围占公司整体数据资产的比率。最简单的计算方式就是:平台纳管数据资产/公司整体数据资产管理目录
质量问题下降率
质量问题下降率指的是开展数据资产管理之后,质量问题数对比未开展管理工作之前的比率。主要衡量数据资产管理工作在提升数据质量方面的成效。
用户满意度
用户类型
内部用户:公司内对数据资产以及数据资产管理平台进行使用的人。
商业用户:在数据资产交易所购买并使用当前数据资产的人。
评价指标
平台/数据易用性:用户友好的数据服务界面和易用的数据资产,都可以提高用户使用数据的便利性和效率。
技术支持:在出现平台与数据资产使用过程中,需要有完善的文档说明,并且遇到的使用问题需要及时进行技术支持。
八、思考
数据资产管理概念混乱的根源
1. 涉及内容较多:数据资产管理涉及到数据的各个方面包括:平台、数开、数仓、治理、质量、交易、安全、合规等多个方面。这些领域的知识都相当复杂,因此很难用一个简单的概念来概括。
2. 发展速度快:随着国家政策的不断推进:数据要素化、数据资产入表、国家数据局等,数据资产管理的理念和方法也在不断发展和变化。这就导致了关于数据资产管理的概念也在不断更新,使得人们很难把握其全貌。
3. 实践性强、千人千面:数据资产管理不仅仅是理论,更多的是实践。不同的企业、不同的行业、不同的业务场景,对数据资产管理的需求和方法都会有所不同。这就需要我们根据具体情况,灵活运用和创新数据资产管理的理论和方法。
4. 价值认识不足:目前很多人对数据资产管理的重要性认识不足,认为只要把数据存起来用起来就可以了,没有必要进行复杂的管理。这种观念导致了很多企业在数据资产管理上的投入不足,也就无法深入去推进。
0 条评论
下一页