您的位置: 首页 > 文章 > RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

分类: 文章 • 2024-05-13 18:52:28

FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction

Tongwen Huang, Zhiqi Zhang, Junlin Zhang

Sina Weibo Inc.

https://arxiv.org/pdf/1905.09433.pdf

在facebook，新浪微博这种互联网公司中，广告以及信息流排序至关重要。

很多实际广告和信息流排序系统中，点击率预估起着核心作用。关于点击率预估，现有的比较流行的模型包括了逻辑回归，基于树的模型，基于分解机的模型，还包括了基于深度学习的模型。

但是，很多现有工作计算特征交互的方式比较简单，比如内积等，这些方式对特征重要性没有过多关注。

这篇文章提出一种新的模型，FiBiNET，全称为Feature Importance and Bilinear feature Interaction NETwork，该模型能够动态学习特征重要性以及细粒度的特征交互。FiBiNET能够利用Squeeze-Excitation网络（SENET）机制来学习特征重要性，而且，该网络能够利用双线性函数蓝学习特征之间的交互。

在两个真实数据集上的大量实验表明，这种浅层网络效果优于其他浅层模型，比如FM，FFM。为了进一步提升效果，将这种网络与经典的DNN结合得到一种深层模型。深层FiBiNET优于其他效果非常好的模型，比如DeepFM以及XdeepFM。

这篇文章的贡献如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

这种新网络的组成描述如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

整体结构图示如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

embedding层的组成及维度描述及标记如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

SENET流程描述如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

SENET所对应的结构图示如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

其中Squeeze的过程主要依赖于pooling操作

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

excitation操作的描述如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

该操作类似于自编码操作

reweight操作过程描述如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

关于特征交互，本文的方法结合了内积和Hadamard积

图示如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

特征交互又分为三种情况

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

各种情况下参数总数不同，第三种交互所需参数最多

连接层比较简单，将两个向量拼接起来

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

几种模型之间的关系如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

数据集描述及分割策略如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

评价标准及特性如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

实验环境及参数设置如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

在浅层模型的效果对比如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

在深层模型中效果对比如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

不同的交互组合方式效果对比如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

这里的不同组合解释示例如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

不同的双线性交互效果对比如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

针对embedding层大小，实验结果对比如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

层数对模型效果影响如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

隐含层单元数对模型效果影响如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

不同成分的影响如下

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

其中BI SE分别对应双线性交互层以及SENET

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET 我是分割线

您可能感兴趣