XdeepFM模型
2020-03-07 20:34:35 13 举报
xdeepfm
作者其他创作
大纲/内容
XDeepFM模型
模型优点
为每一个field(one-hot编码后特征)学习一个隐向量(每个隐向量都固定维度),因为一个field可能包含多个编码(多值离散特征),所以每一个field就包含多个隐向量。对于一个样本,每一个field有一个或几个隐向量,即one-hot编码后特征为对应为的隐向量,若field中只有一个隐向量出现,那么这个特征的隐向量就作为field的隐向量,若有多个隐向量出现,多个隐向量的和作为field的隐向量。
模型构成:LR + CIN + DNN
输出
embedding嵌入层
CIN(压缩交互网络)优点
不同结构共享embedding向量
模型自动学习特征交叉
(1)one-hot编码(2)userId跟itemId编码(3)人工特征交叉( 可单独输入给LR)
显式 VS 隐式特征交互
(1)线性结构学习低阶特征,包括人工交叉特征(2)CIN结构显式地学习到向量及特征交互(3)DNN结构隐式地学习到高阶特征交叉
以两个特征为例xi和xj,在经过一系列变换后,我们可以表示成 wij * (xi * xj)的形式,就可以认为是显式特征交互,否则的话,是隐式的特征交互
模型调参
embedding层(嵌入层)
(1)embedding大小,32,64等(2)DNN结构层数及每层神经元个数等(3)CIN结构层数(4)学习率、激活函数、优化器等
特征输入
特征处理
元素级 VS 向量级特征交互
(1)向量级别的特征交互(2)显式的高阶特征交互
集成的CIN和DNN两个模块能够帮助模型同时以显式和隐式的方式学习高阶的特征交互,而集成的线性模块和深度神经模块也让模型兼具记忆与泛化的学习能力。在具体的应用场景下,不同的模块也可以接入各自不同的输入数据,例如,线性模块中依旧可以接入很多根据先验知识提取的交叉特征来提高记忆能力,而在CIN或者DNN中,为了减少模型的计算复杂度,可以只导入一部分稀疏的特征子集。
0 条评论
下一页