推荐算法
2019-07-07 17:12:30 33 举报
AI智能生成
推荐算法
作者其他创作
大纲/内容
分类
基于内容
理论依据
信息检索
信息过滤
定义
根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项
方法
启发式
用户凭借经验来定义相关公式,然后再根据公式的计算结果和实际结果进行论证,然后再不断修改公式以达到目的
tf-idf方法
基于模型
根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型
优点
推荐结果直观
容易解释
不需要领域知识
缺点
新用户问题
复杂属性不好处理
要有足够数据构造分类器
基于协同
基于一个这样的假设:跟你喜好相似的人喜欢的东西你也可能喜欢。所以基于用户的协同过滤主要的任务就是找出用户的最近邻居,从而根据最近邻居的喜好做出未知项的评分预测
步骤
用户评分
显性评分
直接给项目评分
隐性评分
通过评价或是购买的行为给项目评分
寻找最近邻居
算法
皮尔森相关系数
余弦相似性
调整余弦相似性
推荐
存在瓶颈:用户数量过大时,寻找最近邻居的复杂度会大幅增长
优点
新异兴趣发现、不需要领域知识
随着时间推移性能提高
推荐个性化、自动化程度高
能处理复杂的非结构化对象
缺点
稀疏问题
可扩展性问题
新用户问题
质量取决于历史数据集
系统开始时推荐质量差
关联规则
以关联规则为基础,把已购商品作为规则头,规则体为推荐对象
难点
算法的第一步关联规则的发现最为关键且最耗时,是算法的瓶颈,但可以离线进行
商品名称的同义性问题也是关联规则的一个难点
优点
能发现新兴趣点
不要领域知识
缺点
规则抽取难、耗时
产品名同义性问题
个性化程度低
基于效用
建立在对用户使用项目的效用情况上计算的
核心问题
核心问题是怎么样为每一个用户去创建一个效用函数
用户资料模型很大程度上是由系统所采用的效用函数决定的
优点
无冷开始和稀疏问题
对用户偏好变化敏感
能考虑非产品特性
缺点
用户必须输入效用函数
推荐是静态的,灵活性差
属性重叠问题
基于知识
在某种程度是可以看成是一种推理(Inference)技术,它不是建立在用户需要和偏好基础上推荐的。基于知识的方法因它们所用的功能知识不同而有明显区别
优点
能把用户需求映射到产品上
能考虑非产品属性
缺点
知识难获得
推荐是静态的
组合推荐
由于各种推荐方法都有优缺点,所以在实际中,可以组合使用推荐算法
组合方式
加权
加权多种推荐技术结果
变换
根据问题背景和实际情况或要求决定变换采用不同的推荐技术
混合
同时采用多种推荐技术给出多种推荐结果为用户提供参考
特征组合
组合来自不同推荐数据源的特征被另一种推荐算法所采用
层叠
先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步作出更精确的推荐
特征扩充
一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中
元级别
用一种推荐方法产生的模型作为另一种推荐方法的输入
0 条评论
下一页