《标签类目体系》读书笔记
2022-02-09 16:10:45 8 举报
AI智能生成
数据资产设计的落地方法论:标签类目体系,让数据资产不再是空中楼阁
作者其他创作
大纲/内容
“用”数据而非“管”数据
以技术来驱动数据中台建设,也许从方向上就错了!
数据资产能给业务带来经济价值的数据资源
数据资产是什么?
数据中台的价值在于让业务快速试错,在千百次的试验中找到并发挥数据的商业价值
数据中台的价值是什么?
前言
数据孤岛,无法打通
烟囱式建设,重复造轮子
各说各话,没有统一口径
鸡同鸭讲,无法穿透业务层
数据人员的梦魇,数据治理永远没有尽头
数据部门的尴尬,被命运扼住咽喉的成本中心
第1章 因:6大数据困局
第2章 源:6段由来过程
标签类目体系是中台概念的核心落地点
前台:直接面向业务
后台:底层支撑系统和服务
把后台中常用的数据资源沉淀在中台,并快速响应前台的业务调用
中台:承接、消弭前台和后台之间的差异
前台、中台、后台三者之间的关系
前台和后台的差异:前台要灵动,后台要稳定前台要连接打通,后台资源有时天然不打通前台越拆越小,要的是速度,叫小前台;后台越建越大,要的是全面,叫大后台
必须考虑可复用性
一定不是用来解决单一场景问题的
标签的适用范围
让业务人员能阅读、理解、方便地使用数据
业务人员查看数据资产就像逛淘宝一样
数据资产化的必经之路
数据资产可复用
需要更具价值的数据资产
好的数据资产设计办法
数据资产必然走向业务导向
面向业务可理解
标签是数据商品化的最佳载体
数据价值可衡量
第3章 义:3点产生必要
标签类目体系方法论
由来篇:因何产生,为何需要
“根”对应的数据粒度为“对象”
实体对象(人、物)
关系对象(强关系、弱关系)
“对象”分两大类型
根:决定这是一颗什么树
枝干:标签分类
对象的各种属性,即标签
标签取值是否经常变化
动态标签 vs 静态标签
标签类目体系实质上是对“对象”属性的模式设计
打标签:标签赋值
标签设计:标签定义
打标签 vs 标签设计
叶子:标签
根、枝干、叶子
实体树之间通过关系树连接
关系树向实体树赋予能量
每新增一种动作、行为、连接,即关系树,就会在实体树上映射转化出一片新类型的叶子
能量
业务使用是对标签树的养分供给
养分
将没有使用的标签下线是必须考虑的标签生命周期过程
凋零
森林,就是某个具体场景
最终梳理出一片森林,而非一颗树
能量、养分和凋零
标签类目树形态是适应业务发展生长的结果
优点:全面规划,面向未来,可以指导企业在数据端的全面布局
缺点:建设周期长,见效慢,建设过程会遇到的阻力很大
完整规划,由浅入深
优点:标签直接作用于业务,可以快速得到业务滋养并呈现数据价值,受到的质疑与阻力小
缺点:当业务、标签不断变化调整时,整个类目结构可能会有较大的变动,甚至重构,影响较大
纵深打穿,从局部直接截取
建设资产树的两种模式
分形结构与资产树栽种模式
通过资产目录/门户/集市界面,清晰明了地看到所有对象的标签类目体系
资产清单
在设计好的标签类目树模式下的具体个体实例,即每个对象个体
资产实体
数据资产库
标签在线查询
个人画像查询
查询服务:OLTP
人群画像洞察分析
离线分析
分析服务:OLAP
离线圈选人群
圈选服务
标签类目体系的三种常见的数据服务
外框
资产树使用模式推演
第4章 道:4个核心原理
数据在哪?
数据价值在哪?
数据怎么用?
数据认知
将各业务系统中的数据进行清洗、交换,并最终汇总到企业的数据中心
业务数据化
将原始数据梳理、加工成可供业务理解、查看、使用的数据资产
数据资产存放在资产管理工具中
不断的治理优化
数据资产化
在资产中心中,经过标准化组织和梳理的数据资产,经筛选后被灌入服务组件中
业务人员、产品经理、应用开发人员只需快速配置即可创建数据服务(API)
在服务中心中,可以对所有数据服务的调用、运行等情况进行计量、全局监控和调度配置
资产服务化
创建好的数据服务(API)可以直接对接现有的业务系统或者封装成带交互界面的数据应用产品
最终支撑业务解决问题或者提升业务执行效率,产生商业价值
服务业务化
数据架构
领导层:进行相应的组织架构支持
管理层:制定以数据为导向的具体作战计划和考核指标
执行层:努力工作
执行保障
以数据资产价值的实现为最根本目标
价值驱动
具有复用价值的数据资产项和数据服务能力可以沉淀在数据中台中
当业务场景发生变化时,可以从数据中台中快速抽取所需数据资产项和数据服务能力,耦合在一起,供场景所用
场景能力
统一的数据思维
业务场景调研
需求痛点调研
数据摸底调研
充分的前期调研
根据业务流程梳理数据类目体系
根据业务需求梳理标签类目体系
正确的落地思路
3个构建前提
先研究“对象”(树根)
人、物、关系
识别对象
解决某一对象多源数据打通问题
ID与ID间的关联运算,要考虑准确率
ID-Mapping技术
企业内容统一的主ID
One-ID
强身份属性的ID
身份证、护照、驾驶证、人脸ID、指纹ID等等
第一级别ID
设备相关的ID
手机号、手机IMEI、IDFA、MAC、邮箱地址等等
第二级别ID
注册账号相关的ID
支付宝账号、微信账号、淘宝账号、QQ号等等
第三级别ID
临时记录相关的ID
Cookie、IP地址、GPS定位、操作行为等等
第四级别ID
4种级别的ID
同一对象数据打通
将现实世界的所有事物都映射为“人”、“物”、“关系”三类对象
系统性地向下梳理各个对象全维度的标签,以及标签下的具体标签值
现实世界 -> 对象 -> 标签 -> 标签值
注意:这里没有类目(树枝),只有对象(树根)和标签(叶子)
数据化的事物表达(数据映射)
“数据类目体系”中的“数据”特指企业初始化存储的系统数据
数据库、数据表、数据字段的组织方式 相应转化为 数据类目
类目梳理(树枝)
注意:这里说是构建,其实更多的是熟悉现状
构建数据类目体系
标签是指从原始数据清洗加工而来,能够为业务所用并产生价值的数据资源
标签一般都需要结构化到字段粒度,保障服务化使用
什么是标签?
数据可行性(有数据)
业务上需要
标签设计的两大前提
如果标签数量较多时,可以将类目深度转化为类目广度
类目体系一般不超过三级,分级层数不宜过多
三级分类结构,每级分类不超过10个,即总类目数不超过1000个
标签类目体系设计的建议
构建标签类目体系
侧重于对业务场景的响应,随着业务场景变化而变化,是灵活可配置的
场景化、不稳定,更贴近业务需求
负责人:业务产品经理
前台类目(业务标签树)
与业务场景松耦合,保持对人、物、关系各类对象的全局、稳定的标签定义
可复用、稳定,有广泛价值
负责人:数据资产设计师
后台类目(数据基础标签树)
前后台标签类目体系
6个设计步骤
第5章 法:完整的设计方法
将数据提炼转化为标签的过程称为“标签化”,需要考虑两个因素
是否具有数据可行性
是否能体现业务价值
需要考虑两个因素
标签化
元标签是对标签对象的属性描述,旨在采用业务化的术语,帮助前端业务更好地理解标签
业务元标签:偏向业务理解
技术元标签:偏向技术方向
元标签分为
标签所属根目录(查询主键key)
标签所属类目(标签分类)
同一个标签应该只有一个标签名
标签名 = 时间维度 + 渠道维度 + 品类 + 原子标签
统计类标签:使用同类语句结构
算法类标签:名称中增加“预测”
标签命令规范
标签名(中英文名)
标签描述
原始数据库表中存在的字段,经过简单规范后成为标签
一般是基础属性类标签
原始类标签
原始数据经过ETL加工成为标签
一般是行为习惯类标签
统计类标签
原始数据经过算法模型计算后的深加工类标签
一般是高级抽象类标签
算法类标签
标签加工类型
标签逻辑
枚举值
范围值
值字典
数值型
文本型(字符型)
日期型
键值型
取值类型
示例
更新周期
可对外公开,安全等级最低
L1:公开标签
在企业内部可直接使用,安全等级较低
L2:内部标签
在企业内部需要申请授权后使用,安全等级较高
L3:保密标签
在企业内部只有少数人可使用,且不可传播,安全等级最高
L4:机密标签
安全等级
手工登记填写
系统映射自动填写
标签对应的物理存储信息
标签负责人
标签更新时间
重要的元标签
元标签(标签元数据)
标签规范
面向业务人员,可通过标签组合工具在交互界面上对现有标签进行自由组合配置,实现新标签的设计和使用
可视化、零代码、自助实现
组合标签
数据服务是指通过API形式提供某种数据功能,以满足业务系统调用所需
多个接口API,使用灵活
数据服务
数据应用是指面向业务侧提供带交互界面的数据功能组合,是数据应用结果的系统呈现
数据服务 + 可视化组件 = 数据应用
端到端、零代码、一站式
缺点:对于非常见、定制较多的功能和呈现方式是无法支持的
数据应用
标签使用
标签设计
标签开发
上架后的标签,才能使用
标签上架
数据同步
数据服务+数据应用
血缘信息
元标签
质量管理
安全管理
标签治理
推广宣传
标签营销
标签的全生命周期运营
数据源安全性
数据源准确性
数据源稳定性
数据源时效性
数据源全面性
数据来源类相关指标
标签测试准确率
标签产出稳定性
标签生成时效性
标签取值覆盖量
标签完善度
标签规范性
标签值离散度
标签加工过程相关指标
标签使用准确率
标签调用量
标签受众热度
标签调用成功率
标签故障率
标签关注热度
标签持续优化度
标签持续使用度
标签成本性价比
标签使用过程相关指标
标签质量
标签数据源采集与存储成本
标签设计与加工成本
标签使用与营销成本
标签成本
通过标签分析发现高成本环节
通过标签决策发现低效率环节
企业内部经营管理优化:降本增效
企业对外的数据业务赋能
合规的数据交易产业
市场价值
普惠民生的社会价值
社会价值
标签价值
标签方法论:面向业务端的数据资产复用
数仓建模:偏重数据治理、数据规范、按领域建模
标签方法论与数仓建模的异同
第6章 术:使用技法与重要问题
理论篇:基础原理与演绎推导
标签工具是一种从业务建模、数据同步、资产加工到服务应用的标签全生命周期集成运营平台
标签方法论:对象--类目--标签的树状方式组织数据
对象设计
类目设计
标签体系设计(标签树设计)
标签加工:标签开发
标签同步:标签值同步到目的存储系统中
标签同步加工
标签维护:上架、下架、解绑、审核、修改等操作
标签标准:对标签类目的命名、取值、格式等的一致约定
标签质量:对标签全生命周期中的质量问题进行识别、度量、监控、预警
标签价值:通过标签调用量、标签活性、标签热度、场景贡献、业务好评率等多方面因素反映
标签安全
标签管理(元数据)
标签集市
收藏标签
申请标签使用
标签门户
数据查询(在线点查)
群体圈选
群体分析
群体洞察(圈人、分析)
微观画像(个人画像,比较敏感)
标签工具的核心模块
标签工具
用户标签一般适用于面向C端的业务场景
例如:个体画像、精准营销、个性化推荐等
用户标签类目体系模板
商品标签一般适用于商品研究分析、商品商机上下游撮合、商品生产库存风险预警、商品个性化推荐、商品舆情评论、商品溯源监控等数据应用场景
商品标签类目体系模板
工商注册的法人主体或者社会机构
企业标签类目体系模板(加盟商)
员工标签适用于企业内部人力资源管理、人才培养优化、绩效考核薪酬制定,企业外猎头推荐撮合、仁财筛选影响力评价等业务场景
员工标签类目体系模板(企业内部)
4个经典模板
第7章 器:标签工具和经典模板
银行业卡业务精准营销场景
汽车业整车厂商可视化大屏场景
制造业B2B平台供应链金融场景
零售业电商千人千面推荐场景
地产业物管效能分析场景
第8章 践:从标签到应用的5个最佳实践
数据标签化的成果体现在对数据和业务、资源与价值的串联上
串联
标签化的数据资产具备可阅读、易理解、好使用、有价值的特征
业务友好
通过标签类目体系可以实现对象的全息刻画
全息刻画
标签以其良好的组织形式,实际上完成了对数据资产的工程化封装
可复用
生命周期管理
治理类管理
价值链路管理
可管理
数据资产的走向顺应业务价值的流向
运营模式的内在动力不再是强制手段,而是自发的价值驱动
可运营
创新场景
标签的7点价值总结
第9章 果:价值、案例、经验分享
实践篇:商业实战中的价值涌现
《标签类目体系:面向业务的数据资产设计方法论》的读书笔记
0 条评论
回复 删除
下一页