推荐系统
2018-10-22 10:53:14 103 举报
AI智能生成
《推荐系统实践》思维导图
作者其他创作
大纲/内容
简述
推荐系统
任务:联系用户与物品
信息过载
搜索引擎
分类目录
长尾分布
应用
电子商务
视频网站
音乐电台
社交网络
阅读
位置服务
广告
评测依据
准确率与召回率
覆盖率
多样性
新颖性
惊喜度
信任度
实时性
健壮性
利用用户行为数据
评测指标:准确率,召回率
基于用户行为的协同过滤
找到和用户兴趣相似的用户集合,推荐用户未产生行为的物品
余弦相似度
倒排表
关于用户相似度的优化
缺点
计算量太大
反映和用户兴趣相似的群体兴趣
基于物品的协同过滤
计算物品相似度,生成推荐列表
倒排表
缺点:对用户活跃度敏感
反映用户的历史兴趣,个性化
区别
基于用户行为的是以用户为角度,去搜索和用户行为类似的其他用户集合,然后推荐集合用户产生行为的其他物品
基于物品的是以物品为角度,去搜索对此物品产生行为的其他用户同时对其他物品产生的行为,计算物品相似度,推荐相似度高的物品
隐语义模型LFM
思想:定义隐类,多通过聚类分类
方法:随机梯度下降
适用于TOPN推荐
LFM与上述算法的区别
LFM是学习,上面的更多是统计
LFM较上面的方法复杂
LFM难以生成实时推荐,每一次都要计算所有物品兴趣权重
前者很好解释
基于图的算法
用户和物品之间进行关系连线,度量与用户节点没有连接的节点的关联性
随机游走,物品被游走的概率将收敛
推荐系统冷启动
问题分类
用户冷启动:新用户加入
物品冷启动:新物品加入
系统冷启动:新的系统
尽可能获得更多信息
利用用户注册信息
统计学信息,兴趣描述,站外数据
初次推荐反馈兴趣
初次推荐特点
热门
具有区分性
具有多样性
利用物品内容信息
USERCF将新物品投放给曾今喜欢过与其类似的物品的用户
ItemCF利用物品的相关属性来进行推荐以及判定物品相似度
专家标注
利用用户标签数据
UGC标签系统
豆瓣
基于标签的推荐系统
评价:准确率,召回率,多样性,覆盖率
统计用户常用标签,统计打过一个标签最多的物品,对用户推荐常用标签物品
问题:标签清理,同义词,停止词
基于图的推荐
用户,物品,标签组成的三元图
利用随机游走策略
解释标签
给用户推荐标签
方便输入,提高质量
推荐方法
热门
用户经常使用的
将前两者加权
评测指标
准确率,召回率
基于图的标签推荐
利用上下文信息
用户所处环境,时间,地点,心情
时间上下文信息
影响:用户兴趣,物品生命周期,季节
物品生命周期
物品平均在线天数
相隔T物品流行度差距
推荐信息的实时性
一定条件触发改变
长期行为与短期行为
推荐算法的时间多样性
推荐内容要随时间变化
解决
随机改变
适当对推荐过的进行降权
每天使用不同算法
算法
最近最热门,计算时引入时间衰减参数
与时间有关的基于物品的协同过滤
相隔时间短的相似度高
近期行为权重比以前的高,更能体现兴趣
与时间有关的基于用户的协同过滤
差不多时间两个用户的相同行为相似度高
同类用户最近的行为更具有代表性
基于图的模型
地点上下文信息
距离
特点
兴趣本地化
活动本地化
利用社交网络数据
途径
电子邮件,大型公司
用户注册信息
位置数据
论坛,讨论组
聊天工具
社交网站
数据简介
一般利用图来表示社交网络联系
社交网络数据分类
双向社交网络QQ
单向社交网络微博
社区网络百度贴吧
给予社交网络的推荐
好处
信任度较高
解决冷启动问题
问题
好友兴趣度一致性问题
基于领域的社会化推荐算法
计算方式:好友对i物品的喜欢程度,好友间的相似性
基于图的社会推荐算法
算法:随机游走
基于社区的网络是一个三元图
给用户推荐好友
方式:依据当前好友以及行为给用户推荐好友
基于内容推荐
学校,住所,位置,兴趣
基于兴趣推荐
基于用户的协同过滤
基于社交网络
指标
用户关注好友重合度
关注用户重合度
关注于被关注重合度
无向社交网络中指标相同
基于用户调查
基于六度原理,图的半径最大为6
推荐系统实例
外围架构
日志存储系统,推荐系统,UI,日志系统
行为:购买,评论,收藏,评分,分享
推荐系统架构
用户于物品的连接
物品
用户
特征
统计学特征
行为特征
话题特征
推荐引擎
通过多个推荐引擎分析不同特征,然后按照权重优先级排序
推荐引擎架构
结构
行为特征转换,输出特征向量
将特征向量转换为初始物品推荐表
对推荐列表进行过滤排序
用户特征向量
组成:特征,特征权重
特征向量决定因素
用户行为种类
行为产生时间
行为频率
产品热门程度
特征-物品推荐
数据库存储格式:特征,物品,权重
一般特征-物品相关表不止一张
过滤
产生过行为的物品
候选产品以外的物品
质量差的物品
排名
排名模块
新颖性
降低热门产品权重
多样性
分类取最高
控制推荐理由出现次数
时间的多样性
0 条评论
下一页