数据处理架构1
2016-09-28 15:47:51 0 举报
推荐设计
作者其他创作
大纲/内容
推荐日志
HIVE1.资源表 2.浏览 3.点赞表 4.收藏表 5.推荐候选集表 6. 推荐反馈表
添加推荐解释
根据uid取得初期推荐列表
离线计算(每天计算) 1.用户特征=sum(各行为tags特征值*行为权重*时间衰减权重) ------------------------------ | uid | tags | score| ------------------------------- 2.图片特征 (清洗,分解tags) -------------------------- | tags | cid | pv | ----------------------- --
在线计算每5分钟计算1..推荐反馈表 -------------------- | uid | cid | ---------------------
内存表5.推荐候选集表
内存表过滤后的推荐列表
内存表9.用户反馈表
排名 热门的物品进行降权物品权重降序排名 物品质量降序排名 多样性(根据tags分组选择前几名)
flume
1.资源表更新日志 2.浏览日志 3.点赞表更新日志 4.收藏表更新日志 5.推荐候选列表集 6. 推荐反馈日志
HIVE7.用户特征表 8.图片特征 9.用户反馈表
最终推荐列表
内存表初期推荐列表 -------------------------------------- | tags | cid | pv | score| ----------------------- -------------
kafka
SparkStreaming
过滤用户已经产生过行为物品候选物品以外的物品
0 条评论
下一页