标签生命周期管理
2024-03-08 09:40:43 0 举报
AI智能生成
标签生命周期管理
作者其他创作
大纲/内容
原子属性标签
原子衍生标签
组合/线索标签
标签范围(只包含新画像体系的标签)
最近90天是否还有被在线调用
在线
最近90天是否还有被离线使用
离线
标签调用情况
口径变换导致标签不可用
标签支持方案调整
其他原因
指标加工
监控报表配置
1. 指标监控:定期输出待下线的标签
需求沉淀
评估方法
要求:标签的调用方需要精确到人
FSS(最大调用方)
octosql, data-feature 主要是老的调用,只能到表级别
其他调用方,待挖掘
直接访问在线存储(看是否可以定位到,如果不行只能基于上面的流程进行筛选后,拉运维同学一起来看了,再评估)
调用方
1. octosql, data-feature 调用梳理,需要定位到调用方以及将调用日志输出,推进迁移
2. 标签在线调用底层数据建设
3. 通过fss接入的能定位到业务方吗?模型调用..
需求沉淀:
要求:标签的调用方需要精确到人,待确认
例行ETL,对于画像大宽表应该没有下游了
BI平台
DS自主探查
接口/脚本(待确认)
应用方
1. BI平台各模块标签使用监控建设,高优
2. DS自主探查,根据执行sql解析,中优
3. 例行etl检测,低优
4. 标签使用检测脚本开发,能查看各个数据源该字段是否还有在调用
依赖信息
短时间内无法做到字段级别的血缘查询,所以可能会有误判,漏掉一部分调用方。扫代码库?
隐患
1. 评估待下线标签
对于只能精确到表的调用方,应该确认清楚具体的标签
1. 确认调用方
2. 在线/离线
3. 影响的业务
风险评估:预测下线可能带来的风险
时间确认:如果还有使用方,与使用方一起沟通切换和下线时间
数据备份:在删除任何数据之前,确保有完整的备份
1. 数据备份方案
2. 制定标签的下线计划
1. 待确认使用方已经下线且没有调用后,在画像平台上调整标签状态(应该区分在线和离线使用场景),走审批流
2. 数据加工调整,停止在线同步流程或者停止加工
1. 优化标签加工逻辑,提高标签同步效率
2. 衍生标签信息维护
3. 操作标签下线
4. 效果评估
标签下线
标签生命周期管理
收藏
收藏
0 条评论
下一页