画像存储方案
2021-01-22 11:01:31 0 举报
实时用户用户画像存储方案简述
作者其他创作
大纲/内容
F_Old
通过Yid查询Hbase中Feature信息,F_New和F_Old 进行merge操作,并重新生成Feature信息,并入库
响应 yids
查询关键词(IDMapping)
事实标签
Events 事件
Event 转换为Feature
hbase
Feature 之间进行merge操作,输出一条全量信息的Feature
响应结果
架构优点1. 信息不会因为人物信息可变性,而发生信息不可用架构缺点1. 可能会丢失部分数据
Feature
Feature Merge组件
查询方案
将在hbase中查询出来的Feature进行merge操作,并返回单一的Feature信息
响应Feature(s)
实时人物画像点1. 人物信息不确定性,从无到有2. 人物信息可分裂性,一个人的信息可能分裂为两个人3. 人物信息可合并性,两个人可能合并为一个人人物标签分类1. 事实标签(通过每条数据可以获取部分或者全部标签)2. 统计标签 (通过时间段内全量数据统计而来)
入库方案
Feature Merge 方案1. 按照事件发生时间使用最新字段(部分字段)2. 按照事件可信度进行分级,可信的事件进行强制更新3. 按照其他字段进行推算,例如按照身份证推算生日、性别4. 字段累积, 例如邮箱,工作单位
F_New
0 条评论
下一页