基于概率隐层模型的购物搭配推送:阿里巴巴提出新型用户偏好预测模型

作者: 机器之心 2017-08-07 11:09:19
论文:Recommending Complementary Products in E-Commerce Push Notifications with a Mixture Model Approach 

论文

论文链接:https://arxiv.org/abs/1707.08113

这篇文章中,阿里研究者们对电商领域营销推送场景进行了点击率的优化。营销推送场景和传统电商推荐场景有很多类似的地方,但也有所不同。首先,营销推送的点击率受文案影响很大,和用户直接相关的文案的点击率会明显高于通用的推送文案;其次,每次营销推送只有一个展示坑位,因为对推送商品的准确度要求更高。

为解决***个问题,我们进行「购物搭配」场景的推荐。购物搭配场景推送一个和用户已购买商品的搭配商品,比如当用户买了高级茶壶后对上好茶叶进行推送(下图第二个推送信息)。购物搭配的好处是文案中可以透出用户已购商品,消息可以和用户建立强烈的 attachment,提升消息打开率。

推送信息

为寻找搭配商品对,我们定义如下两个指标:

1)同时购买分数(Co-Purchase Graph)

2) 看了又买分数(View-and-then-Purchase Graph)

***个指标衡量了两个商品之间的互补性(complementarity),第二个指标衡量了两个商品的替代性(substitutivity)。购物搭配场景下,我们希望寻找高互补性、低替代性的商品对进行推荐。因此,我们把商品对「搭配性」的得分定义为:

这个分数是我们推荐模型中的一个重要特征。

为了解决推荐准确性的问题。我们对用户分层进行更细致的刻画。我们的主要思想是基于用户行为对用户的向量表示(Embeddings)进行学习,然后我们用这些向量表示对用户的行为进行预测。向量表示可以理解为对用户在高维度的一个量化的抽象表示。

向量表示的好处是可以更精准,更灵活的对目标进行表达。举个例子,我们对用户的描述不仅仅局限于年龄、消费能力等人可以 Intuitively 容易想到的维度,人工智能可以自动从消费者数据中学习到更全面更抽象的维度,比如用户对推荐平台的依赖程度,用户对选择商品的创新性等。

用户向量的学习我们采用的是概率隐层模型(Probabilistic Latent Class Modeling)。首先我们定义用户点击模型如下:

这个模型分为两层,***层是隐层用来刻画用户在高维度下的分层,采用多维逻辑回归分类的形式。

第二层是点击率预测模型。我们这里选择了一个二维逻辑回归模型。不过可以很容易的扩展使用深度神经网络。

我们要在已知用户特征和点击数据的条件下估计模型参数。我们采用经典的 EM(Expectation-Maximization)算法。

EM 算法需要先求解 Q 函数:

为优化 Q 函数我们对参数进行迭代优化如下:

上面两个更新很容易通过 Gradient Decent 方法求解。

下图是我们对求解模型的一个解释。我们发现高活跃用户更加看中自己的倾向,预测模型的权重在用户偏好类的特征中高(high model weights on user preference features);低活跃用户更加依赖于平台的推荐,更喜欢平台选择的搭配性好的商品,预测模型权重在商品搭配性的特征权重高 (high model weights on )。这可以直观的理解为深度用户在选择商品上更有自己主见,而新手更依赖于平台。

求解模型

目前该工作在线上取得了不错的效果,购物搭配的推送推荐场景上看到~50% 点击率的提升。

更广义地来讲,这项技术给行业带来的好处的是可以更精准和全面的刻画用户,进一步推广可以用来描述商品、资讯、视频等其他目标。该技术可以帮助使我们的营销推荐更友好(了解用户),同时从商业上提高转化率(高点击率)。

机器学习 用户推荐 转化率
上一篇:机器学习填坑:你知道模型参数和超参数之间的区别吗? 下一篇:免费公开课-人工智能●如何实现和机器人对话?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

用机器学习备忘单解决艰巨问题,你行吗?

在本文中,我们将介绍如何使用备忘单简化机器学习方法,你可以使用该备忘单选择适合解决问题的正确算法。

读芯术 ·  2天前
“阿凡达”式脑-脑接口性能提升 2-3 个数量级

脑-脑接口这一概念,看过科幻电影《阿凡达》的人可能有点印象。在电影中,地球上的人可以通过脑对脑的直接信息传递,远程控制潘多拉星上经基因改造的蓝色类人生物 Na'vi 族。

付静 ·  4天前
探究谷歌用于构建量子机器学习模型的新框架:TensorFlow Quantum

TensorFlow Quantum让数据科学家可以构建在量子架构上运行的机器学习模型。TensorFlow Quantum的核心概念是将量子算法和机器学习程序交织在TensorFlow编程模型中。谷歌称这种方法为量子机器学习,能够利用其最近的一些量子计算框架(比如谷歌Cirq)来实现它。

布加迪 ·  2020-03-26 08:00:00
算法之外:人工智能和机器学习对组织的影响

如今,数字科学对于企业来说,显得愈发地“诱人”。但是若要正确地看待数字科学,我们亟需了解下面一个问题:数字科学到底能为我们的业务发展做什么,不能为我们的业务发展做什么。

IMD商学院 ·  2020-03-24 15:15:54
韩松、朱俊彦等人提出GAN压缩法:算力消耗不到1/9,现已开源

近日,来自麻省理工学院(MIT)、Adobe、上海交通大学的研究者提出了一种用于压缩条件 GAN 的通用方法。这一新技术在保持视觉保真度的同时,将 pix2pix,CycleGAN 和 GauGAN 等广泛使用的条件 GAN 模型的计算量减少到 1/9~1/21。

Muyang Li等 ·  2020-03-23 15:10:49
五大方面:机器学习如何在不久的将来改变教育

如果你目前在学校或者在教育领域工作,那么对即将到来的变化有所了解是非常必要的。在这篇文章中,我们将探讨机器学习在未来几年改善教育的五种途径。

读芯术 ·  2020-03-23 07:18:22
互联网上20大免费数据科学、机器学习和人工智能慕课

现在是2020年,数据科学比以往更加民主化。这意味着任何个人只要有适当的工具和大量的数据,就可以在几乎没有专业知识的情况下进行数据科学研究。随着数据渗透到整个行业的每一个角落,拥有数据科学家的技能是大势所趋,也因此产生了一支会说数据语言的员工队伍。

读芯术 ·  2020-03-22 16:11:48
人工智能机器学习常用算法总结及各个常用算法精确率对比

本文讲解了机器学习常用算法总结和各个常用分类算法精确率对比。收集了现在比较热门的TensorFlow、Sklearn,借鉴了Github和一些国内外的文章。

程序员陈平安 ·  2020-03-20 11:22:09
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载