CTR预估之FM、FFM算法

Posted by Schoko on November 25, 2019

最近需要研究计算广告与推荐系统的算法:CTR(Click-through Rate)预估,模型迭代方面打算从xgb+lr,FM/FFM到DeepFM这个过程来进行。FM、FFM及对应的深度模型在以前从未接触过,所以正好一边学习一边总结资料。

CTR预估

点击率是广告点击次数除以总展示次数(广告投放次数):

ctr_def

目前,CTR的数值平均接近0.2%或0.3%,超过2%被认为是非常成功的。

FM(Factorization Machine)

  • 主要解决稀疏数据下的特征组合问题
  • 对于连续与离散特征有较好的通用性
  • 在高度稀疏的情况下,特征之间的交叉仍然能够估计,而且可以泛化到未被观察的交叉
  • 参数的学习和模型的预测时间复杂度是线性的

tbc