什么是冷启动?

冷启动在推荐系统中表示该系统积累数据量过少,无法给新用户做个性化推荐的问题,这是产品推荐的一大难题。基本上,冷启动问题可以分为以下三类:

用户冷启动:用户冷启动主要解决如何给新用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。

物品冷启动:物品冷启动主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。

系统冷启动:系统冷启动主要解决如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统,从而在网站刚发布时就让用户体验到个性化推荐服务这一问题。
一般解决方案

推送热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐;

利用用户注册时提供的年龄、性别等数据做粗粒度的个性化;

利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品;

要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息,然后给用户推荐那些和这些物品相似的物品;

对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户;

在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。

总结

推荐系统冷启动问题主要是因为系统本身的扩展性不强所导致,在工业上很多时候都是先通过人工标注进行推荐,得到足够的反馈后在线下运行合适的算法进行测试,然后在线上运行。在此过程中可以充分利用物品物品间的品类和关键词进行相似度计算,然后通过用户的注册信息和初步访问的记录进行合适的推荐,形成良好的闭环。