标签体系设计(二)
2023-05-05 11:00:15 1 举报
质量
作者其他创作
大纲/内容
要货记录(关系)
值字典
原始(ID)类标签
统计类标签
前台
必选修饰
静态属性
标签安全等级
商品支持服务
交易记录(关系)
个体隐私数据(C3)
标签开发原始类和统计类标签交由数据开发工程师完成,算法类标签交由算法工程师完成。在标签开发完成后,由数据开发工程师补录完整标签的物理存储信息,如表名、字段名、负责人、完成时间等,完成标签向数据层的映射。
商品交易情况
兴趣偏好
交易结果
业务机密数据(S4)
数字娱乐
基础组件
运营
关系组件
统计/原始类标签
标签营销1、标签开发完成后,对外需要将标签价值进行梳理、宣传和推广,让业务部门人员尽快了解到各类标签信息。
旅游交易类数据
趋势分析(子场景)
个体可公开数据(C1)
关系过程(过程行为)
旅游管理类数据
商品标签类目示例
不同对象间的标签组合
算法/统计类标签
标签的运营闭环
外部门涉旅数据
标签开发
交易记录标签类目示例
库存记录(关系)
3、数据应用:面向业务侧提供带交互界面的数据功能组合,是数据应用结果的系统呈现。在服务组件基础上,将数据服务结果配合可视化组件,形成可视化的数据应用系统向业务端呈现,即生成一个带交互界面的数据应用系统。数据应用系统是业务人员可以直接使用的端到端的解决方案。
沉淀
旅游消费统计分析
兴趣、习惯(提炼)
对象管理
商品发布维护
梳理后台类目
消费者(人)
修饰难度
销售趋势(关系)
1、服务组件:某种数据功能的工程化封装,一般提供交互界面方式实现导入或关联数据标签、服务功能设置等操作。输出方式有两种:1、生成API形式的数据服务,适用于与复杂系统对接或界面、系统定制要求较高的情况;2、生成数据应用系统,直接带有简单的交互界面,可以供业务方端到端地直接使用,简单明了。
根目录
录入
交易品画像(子场景)
销量趋势(关系)
公开数据(L1)
社交关系
部门内部数据(B2)
元标签
系统复用的四个层级
库存预警管理(子场景)
1.单个标签的取值处理加工2.多个标签的取值处理加工
完整设计出与条件相关的标签
标签加工过程相关指标1、标签测试准确率:标签在建模、测试过程中得到的准确率,是一种类似试验性质的初始准确率,供参考。2、标签产出稳定性:标签每天计算、加工、产出时间的稳定性,能否准时产出也是业务人员使用标签时重点考虑的指标。3、标签生产时效性:标签生产的时间间隔,时间间隔越短,时效性越强。时效性对实时标签尤为重要。4、标签取值覆盖量5、标签完善度6、标签规范性7、标签值离散度:离散度没有绝对的好坏,一般场景下离散度越高越好,说明能找出具有不同特征值的各类群体。
关系结果
库存预警(关系)
代码级复用
复合标签
性格特征
更新周期
算法标签类
客流量监测分析
标签值是对象属性的具体取值
商品搜索浏览
服装企业前台标签类目体系
基本属性
旅游社会类数据
数据层
取值类型
服装企业标签类目体系
前后台标签类目体系设计的实施步骤
物
部门保密数据(B3)
关系过程(时空条件)
组件级复用
最近一个月移动端
设计
关系人+关系物
人
“物”标签分类与加工分类
标签的全生命周期运营
部门可公开数据(B1)
GIS组件
类目下挂标签(全集)
跨对象标签组合设计的3个注意点:1、始终记住标签和数据结果是不一样的2、找出两个对象的关联标签非常重要3、标签设计过程与标签使用过程是逆向过程
标签化
订货辅助(关系)
标签描述
交易物
业务可公开数据(S1)
加工类型
仓库(物)
产品级复用
如涉及另一对象条件,则将标签再拆分
关系准备
员工管理分析(子场景)
供应链商品标签体系
场景1
使用
旅游标签体系
行业标签
基本属性(静态、固定)
标签名主要指标签的中文名称,必要时也可以增加标签英文名称。
“物”标签类目设计思路
数据来源类相关指标1、数据源安全性:安全程度,是否合法取得、是否得到用户授权许可等。2、数据源正确性:数据源数据的正确性,是第一现场取得,间接获取,还是边缘推算。3、数据源稳定性:产生周期的稳定性、产生时段的稳定性、产生数据量的稳定性、产生数据格式的稳定性、产生数据取值的稳定性等。4、数据源时效性:数据源数据从第一现场产生到传输录入的时间间隔,行为类数据的时效性会间接影响标签准确性。5、数据源全面性:数据源数据是否全面,各个层面的数据是否都能整合打通,进行全域计算。
性格(挖掘)
购物消费
标签治理
GIS服务组件
避免产生侵犯隐私的误解
场景2
内部数据(L2)
场景3
数据应用层
该场景相关的人+物
同一对象下的标签组合加工方式:1、通过对某对象下单个标签的取值处理加工得到新标签2、通过对某对象下多个标签的取值处理加工得到新标签
标签使用
主从属性
舆情监测分析
关系
行为属性
业务保密数据(S3)
原始(算法)类标签
生活需求
梳理前台类目
示例
生活服务
可视化组件层
...
同类标签使用同类语句结构
智能订货(场景)
标签治理1、血缘信息:标签生产的路径即血缘,是根据历史事实记录每项标签的来源、处理过程、应用对接情况等。2、元标签规范:每个标签都需要登记有业务类和技术类元标签信息,元标签管理需要形成统一的规范体系,对标签进行统一的信息登记和检查。3、质量管理:标签质量管理要贯穿标签从设计、使用到归档等的全过程,其核心是制定一套标签质量管理规则,遵循标签质量标准,并配备可视化的标签质量管理规则,遵循标签质量标准,并配备可视化的标签质量监控平台、标签交叉验证工具登技术支撑。4、安全管理:“三横三纵”,“三纵”指安全理念及整体策略:首先,标签的使用必须符合过节大数据相关政策法规;其次,必须保障所有客户所有数据资产安全;最后,在具体使用过程中,要评定标签敏感性登记,制定相应的安全管理策略和安全实现方案。“三横”指的是采取的核心方法:其一是三重加密机制,其二是可用不可见标签安全体系,其三由所有ID生成的一个核心ID(已脱敏)。
加盟商(人)
价值评估
某服装企业的前后台台标签类目体系
标签名
选择
商品库存分析(子场景)
后台
“关系”标签分类与加工分类
加盟商要货分析(子场景)
可选修饰
标签描述:对标签名用一两句话进行解释,避免标签名由于用词过于简短而存在歧义、模糊、多义等问题。
标签怎么运营
标签是对象的属性,颗粒度到字段级
分级
智慧医疗
标签使用标签的使用有数据同步、数据服务、数据应用等方式。数据同步是指将加工好的标签数据直接同步到业务系统的数据库中,简单粗暴,一般只有核心业务才会这样使用。在这种方式下,标签使用问题与效果难以跟踪,因此不推荐。数据应用是指把标签功能封装成产品交互形态供外部使用,既能跟踪标签调用情况,又能评估标签使用效果。不过这种方式与业务方绑定较深,由于业务人员使用习惯各不相同,业务定制需求较多,通用产品难以满足众多业务前端的个性化需求,扩展性有限。数据服务是指将标签使用方式封装成API形式对接到业务系统,业务人员既可以灵活使用标签,又不需要直接复制标签数据,且调用情况容易跟踪和监控。综上,标签使用的理想方式是数据服务,它最能体现和发挥标签的广泛价值。在使用标签的过程中需要监控其调用情况,来审计其稳定性、安全性和规范性。
企业构建标签类目体系初期:建议由数据部门来统一设计、开发、治理、运营标签,这样做的好处是能让企业尽快一个标准规范的标签类目体系,以供业务部门人员统一认知、理解和使用标签。
加工层
标签所属类目就是上文提到的标签所属一级类目、二级类目、三级类目等。类目层级不一定是三级,需要根据企业的真实情况来具体设置。
标签设计数据资产设计师根据业务调研、数据调研等前期工作开展标签设计工作,产出标签类目体系架构图和标签设计文档,包括标签对象、类目体系、标签名、标签加工类型、标签逻辑、值字典、取值类型、示例、更新周期等元标签信息
时空修饰
库存监控(场景)
门店(物)
1.确定业务需求中的对象2.设计与条件相关的“对象”标签3.涉及多个对象,将标签拆分到最细4.将基础标签配置成组合标签
配置出组合标签,操作标签产出数据结果
功能效用
前后台标签类目体系
商品(物)
案例:创建一个车流量监测分析大屏1、从后台标签池中筛选出监控所需的前台标签集合2、从服务组件库中选择监控服务组件,将前台标签集合导入该服务组件中,并设置相关的监控规则,形成监控数据服务。3、配合使用一些可视化组件,以完成交互体验要求。
智慧旅游应用中利用标签与服务组件快速创建数据应用的流程图
监控服务组件
交易前提
标签使用过程相关指标1、标签使用准确率2、标签调用量:标签平均每日的调用量、今日当前累计调用量、历史累计调用量、历史调用量峰值3、标签受众热度4、标签调用成功率5、标签故障率6、标签关注热度7、标签持续优化度8、标签成本性价比
最近一个月移动端电子产品交易总额
旅游公共信息发布
员工(人)
标签逻辑
类目
销售预估(子场景)
销售分析(场景)
思维
前后台标签类目的联系
统计类复合标签的基本设计规则
个体机密数据(C4)
部门数据
前台场景类目构建完成
标签层
金融信贷
数据类型
标签运营环节中的责任单位
无线标签
管理
“人”标签分类与加工类型
交易金额
业务需求
求和
被动关系
标签运营
类目是对标签的分类类目往往由名词构成。一个类目及其所归类的标签在数据物理层面可以和某张具体表对应,例如”消费者“对象的【基本信息】类目下,有”性别“”年龄“”籍贯“等多个标签,一般对应于消费者数据库中的一张消费者基本信息表,该表中有”性别“”年龄“”籍贯“等多个字段。多张主键相同但信息类型不同的数据表关联在一起就可以形成主键对象下的大宽表。例如将消费者基本信息表、消费者地理位置表、消费者社交关系表按照消费者ID关联在一起,就可以形成一张消费者多维度信息宽表。
算法标签类(习惯-统计类)
1.标签的自由选择2.标签的使用配置
类目下挂标签(子集)
数据/标签情况
服务组件层
商品评价投诉
业务内部数据(S2)
基础属性
什么是服务组件、数据组件、数据应用系统
敏感数据区
前后台类目的联系与区别前台标签类目一般按照大场景/子场景/数据服务等层级展开。在大场景/子场景/数据服务下先抽象出所涉及的对象,再去后台标签类目体系该对象下的标签总集中找到该数据服务所需的标签,并添加到这个前台类目对象下。如果数据服务中某对象下标签多余10个,就可以设计一级、二级等多级类目,将众多标签分别挂在不同的前台类目下。因此可以认为某一个数据场景的前台标签类目是后台标签类目一个标签子集。
网络通信
设备位置
跨对象标签组合设计步骤
营销分析
交易过程
根目录:指向标签所属对象根目录往往是一种较为模糊、宽泛、简单的名词或动名词,例如用户、购房者、酒店、浏览(记录)、交易(记录)、报修(记录)。在数据物理层面往往映射为某张大宽表中的主键,这张大宽表中的信息都是对该主键对象的详细刻画和数据记录:大宽表的列即映射为标签,大宽表的行记录则对应于具体的对象在各标签属性上的具体属性值记录。
行为关系(动态、场景)
确定场景对象(子集)
2、数据服务:通过API形式提供某种数据功能,以满足业务系统调用所需。数据服务因为是API形式,比较适用于与复杂业务系统的对接,主要体现在:1、使用灵活,可以由多个数据服务API组合成一个数据应用系统;2、展示灵活,可以将API与各种可视化组件对接,以满足业务侧在视觉交互方面的独特需求。
个体可共享数据(C2)
序号
服务组件名称
服务组件简介
1
分析服务组件
支持自选标签、分析方式、可视化等;实现对某一特定群体进行多种分析(包含统计、画像透视、关联分析等)功能
2
推荐服务组件
支持自主输入特征标签、推荐对象、设置推荐模型参数等;实现对个体推荐商品、服务、场所等
3
定向服务组件
支持自选标签、自配定向参数;实现通过标签组合方式选定某组人群或对象
4
大屏服务组件
支持自选标签、大屏展示方式;实现大屏端的数据高级可视化功能
5
支持自选标签、监控参数设置、报警方式设置;实现对重点指标在指定条件下的指定对象报警监测
6
舆评服务组件
7
优化服务组件
支持自主输入效果日志数据,选择待优化标签;实现对现有业务效果数据的学习给出在指定标签维度上的优化建议
8
风控服务组件
支持自选风控相关特征(标签),输入正负样本标识,设置算法模型参数;实现对人员、事件的风险预警和识别
9
搜索服务组件
支持自选搜索输入项(标签)、输出项(标签)、设置搜索性能参数;实现自定义条件下的智能模糊搜索
10
指数服务组件
支持设置指数计算的输入特征(标签),输入正负样本标识,设置算法参数和输出格式,实现对某特征属性的综合预测,例如健康指数、价值指数、经济指数等
确定对象(全集)
同一对象下的标签组合
电子产品
标签上架标签开发完成并补充完整元标签信息后,需要将标签在标签管理系统中上架。标签上架后,才能通过标签门户开放、展示给各端业务人员查看、咨询、使用。在此过程中,系统会根据标签的安全等级、部门角色等信息来确定不同账号的数据查看、申请使用权限。权限内容包括可见标签集范围、标签详情信息范围、可申请标签集范围等。
标签设计
保密数据(L3)
商品要货分析(子场景)
被动行为
确定前台场景
个体数据
地理位置
前台类目梳理
交易品概览(子场景)
标签命名三大规则:
商品推广营销
多维组件
商品属性证照
交易时空
什么是前后台类目?前台标签类目是场景化的、不稳定的,更贴近业务需求。前后台标签类目是面向数据应用场景的,但不是所有企业业务场景都要梳理。不涉及数据应用的传统业务场景不需要梳理前后台类目中,因为标签来吗体系的核心本质是为数据应用服务。
三类加工标签与属性分类标签的联系1、原始类标签往往是基础属性类标签,例如会员注册登记的性别、年龄、姓名、手机号码等。基本属性直接描述某一类对象的属性、特征、信息,往往来自基本信息表,其中重要的信息项可以通过简单清洗、数据剪裁等方式转化维原始标签。统计类标签往往是行为习惯类标签,例如最近一个月交易总金额、最近7天收藏店铺名称、最近7天浏览商品总数、最近7天最常交易时间段等,往往是通过对原始交易记录、收藏记录、浏览记录进行ETL开发后得到。算法类标签往往对应于兴趣爱好、性格思维、价值评估等高级抽象类标签。
什么是平台级复用
平台级复用
行为足迹
关系服务组件
后台标签类目构建完成
原子标签
机密数据(L4)
标签加工类型:原始类标签、统计类标签、算法类标签。原始类标签:原始数据表中就存在的字段,经过简单的规整后成为标签,即可被业务人员使用。统计类标签:原始数据通过ETL加工,例如求和、平均、正则表达式、规则运算等简单数学函数运算,成为标签后被业务人员使用。算法类标签:原始数据通过算法模型计算后的深加工类标签,例如经过模式识别、深度学习等算法模型运算后得出的综合评分、预测指数等。
“关系”标签类目设计思路
行为习惯
消费者标签类目体系3.0
场景维度
后台类目管理
消费者画像(子场景)
电商消费
同一个标签使用同一标签名称
业务数据
运输物流
标签所属根目录是指该标签是哪个对象的标签。
优化
标签质量
通用标签
仓库情况分析(子场景)
确定业务需求中的对象
新增
标签上架
交易人
部门机密数据(B4)
如何使用标签
平台级复用的标签使用方式
标签组合
旅游资源立体展示
交通旅行
要货辅助决策(子场景)
辅助
计算方法
车流量监测分析
0 条评论
下一页