抖音算法的底层逻辑
2022-11-17 20:29:03 2 举报
AI智能生成
如果觉得有帮助,欢迎点赞,收藏、克隆!
作者其他创作
大纲/内容
抖音去中心化推荐逻辑
去中心化算法
每个视频的展现机会平等
每个账号都有机会火
流量不仅仅围绕大V
千人千面的需求
自动去重算法
智能分发
附近的人
关注的人
用户标签
内容标签
相似用户
相似内容
达人自动加权算法
明星、达人自动加权
高质量PGC内客扶持
头部MCN机构扶持
热度加权算法
选新去久
热度随时间递减
经过层层加权后会辐射更多用户
播放>点赞>评论>转发
抖音社交推荐算法
社交关系
粉丝推荐
相似用户
互粉相似用户推荐
粉丝推荐
按时间顺席推荐
用户标签
用户标签概览
兴趣特征
感兴趣的类别和主题
感兴趣的关键词
感兴趣额来源
基于兴趣的用户聚类
各种垂直兴趣特征
身份特征
性别
年龄
常驻地点
行为特征
晚上看视频
数据处理策略用户标签的主要处理策略
过滤噪声:过滤停留时间短的点击,打击标题党
惩罚热点:用户在热广文章上的动作做降权处理
时间衰减:随用户动作的增加,老的特征权重会随时间衰减,新动作贡献的特征权重会更大
惩罚展现:如果一篇推荐给用户的文章没有被点击,相关特征(类别、关键词、来源)权重会被惩罚
考虑全局背景考虑给定特征的人均点击比例(做Ll-norm)
用户标签批量计算框架
每天抽取昨天日活用户
抽取这些用户过去两个月的动作数据
在Hadoop集群上批量计算结果
流式计算和批量计算混合适用
大部分userprofile采用流式计算
各个粒度的兴趣标签
垂直领域的profile
对时效性不敏感的user profile采用batch计算
性别、年龄
常驻地点
0 条评论
下一页