如何利用CLimF算法设计推荐系统

作者: 汪昊 2019-04-23 09:00:00

【51CTO.com原创稿件】自 2010 年开始,推荐系统领域出现了许多不同的排序学习的方法。所谓排序学习,指的是推荐系统机器学习算法优化的指标是推荐给用户的物品的排名,而不是具体的评分。排序学习解决问题的思路一般是首先提出一个需要优化的信息检索领域的指标,然后对其进行优化。因为这个指标通常是不光滑的,所以首先需要对这个指标进行近似,使得其成为一个光滑函数。信息检索的指标不同,产生了不同的算法。本文所要介绍的算法叫做 Collaborative Less is More Filtering (CLimF) 是 2013 年在人工智能的权威会议 IJCAI 发布的文章。

CLimF 优化的信息检索指标叫做 Reciprocal Rank (RR) ,是指的推荐给用户的物品列表中***个被点击的物品的排名的倒数。例如,系统推荐了 10 个电影给用户,用户***个点击的是在系统中排名第 2 的电影,那么用 RR 来衡量系统,得分就是 1/2 。因为推荐给用户的物品的列表都是按照推荐系统给出的评分从高到低进行排序的,因此排名越靠前的物品是越被推荐系统看好。所以用户点击的物品排名越靠前,说明推荐的效果越好。这是 RR这个指标设计的初衷。

CLimF 试用的场景是推荐给用户的物品不多,但是比较有价值的情况。比如社交网络里的友邻推荐,在这种场景下,Top 3 或者 Top 5 的推荐通常更有价值。

RR 的正式定义如下:

尽管我们***得到的公式是个光滑函数,但是它的复杂度极高,因此在实际应用中,我们需要找到替代的公式。

***我们通过随机梯度下降的方式对***化函数进行求解。

CLiMF 函数跟其他算法相比的测评效果如下:

CLiMF 与其他算法的比较:

  • CofiRank : CofiRank 是***个将排序学习应用于推荐系统的算法,它优化的指标是 NDCG ,不适合二分类问题
  • Bayesian Personalized Ranking : 需要负样本,而 CLiMF 只需要正样本

作者简介:

汪昊,区块链公司科学家,前恒昌利通大数据部负责人,美国犹他大学本科/硕士,在百度,新浪,网易,豆瓣等公司有多年的研发和技术管理经验,擅长机器学习,大数据,推荐系统,社交网络分析等技术。在 TVCG 和 ASONAM 等国际会议和期刊发表论文 10 篇。本科毕业论文获国际会议 IEEE SMI 2008 ***论文奖。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

机器学习 排序学习 人工智能
上一篇:中国移动研究院常耀斌:主流人工智能技术栈的深度探讨和实践总结 下一篇:统计学和机器学习到底有什么区别?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

人工智能是应对气候变化的新时代解决方案

气候变化是我们这个星球面临的最大挑战,人工智能可以帮助我们应对不断上升的全球气温。

Cassie ·  15h前
草图变真人脸?AI:可以,多草都行

这篇论文讲技术人员如何在styleGAN顶层训练了一个深度神经网络来学习将源图像映射到styleGAN模型的输入,最终输出高质量的目标图像。

丰色 ·  16h前
深度学习算法

深度学习算法在机器视觉中就如一个巧妙的接收转换器般的存在,它灵活、敏捷、“深度”与广度兼具,强悍的计算与预测能力可以称为其魅力之处。深度计算——可以集数亿个神经网络的自拟,对于数据、语音、图像等多种形式的资源进行分析、解释。

三姆森科技 ·  20h前
人工智能工程可以帮助组织充分利用人工智能

“人工智能”这一术语如今似乎无处不在,这在行业市场的应用中造成一些混乱,甚至可能让技术决策者感到困惑。

Bob Violino ·  20h前
人工智能赖以生存的大数据,掌握在垄断者的手中真的可怕

我至今还记得2016年那场旷世人机大战,人工智能软件“阿尔法狗”战胜世界围棋冠军李世石,那是一场标志性的比赛,打破了人们对人工智能的想象。

国学达人观世界 ·  20h前
中美欧人工智能发展现状比较分析

从投资、人才、研究、硬件、应用、数据多个维度,系统对比中、美、欧人工智能发展现状,最终得出结论称,美国当前依然保持着世界人工智能发展总体领先地位,中国在一些重要领域与美国的差距缩小,欧盟在三者中相对落后。

王璐菲 ·  20h前
基于机器学习的自动漏洞修复分析方法

。在本文中,我们提出了一个基于机器学习的自动化框架来自动化电力公司的修复决策分析。我们将其应用于一家电力公司,并对从该公司获得的两个真实运行数据集进行了大量实验。结果表明,该解决方案具有很高的有效性。

佚名 ·  21h前
通过细胞自动机,AI在「我的世界」学会了盖房子

许多研究采用了更为复杂的神经网络规则,被称为神经元细胞自动机(NCA)。但是其应用大多局限于2D结构,或是只能生成简单的3D结构。

子豪 ·  21h前
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载