比赛名称
2021网易伏羲算法大赛
比赛内容
基于强化学习的个性化推荐系统
1 IEEE BigData
IEEE BigData是IEEE旗下大数据与人工智能的国际学术大会,每年一届;该会议已名列中国计算机学会推荐的C类国际会议,最近几年都有韩家炜、杨强等学术泰斗的精彩报告,而且论文接受率较低(不高于19%)。
2 赛题背景
伴随移动互联网时代的发展,在线推荐场景迎来爆发式增长,在序列推荐/商品组合推荐/交互式解锁等多种新颖的推荐系统类型中,使用强化学习等新技术对用户多步决策行为的深度理解越发显得重要且迫切。
围绕强化学习+推荐系统议题,2021网易伏羲算法大赛联合国际学术会议IEEE BigData 2021,从推荐系统应用场景痛点出发,开设两大赛道,兼具算法挑战性和商业应用价值。
3 赛题说明
本次大赛提供源自真实业务的脱敏数据做为训练集,参赛队伍基于训练集构建基于强化学习算法的商品推荐模型。
赛题根据难度分为2个赛道:
· 商品组合购买概率预测
· 商品组合生成
两个任务均以用户购买历史、用户画像、商品特征等做为输入,参赛选手利用强化模型对用户多步决策过程进行理解,得分指标等详见kaggle页面。
每位选手可选择多个赛道参赛。
赛题1:商品组合购买概率预测
对于给定的用户特征和曝光商品组合,通过算法对用户是否分别购买这9个商品进行预测。因为商品之间的显式依赖关系,这并不一个简单的监督学习分类问题。该赛题使用分类准确率进行评分。
赛题2:商品组合生成
对于给定的用户特征和所有商品的价格等信息,通过算法生成用户期望消费金额最高的商品组合。该问题可以建模为强化学习问题,每一步推荐一个或多个商品,来建模商品间的决策依赖关系。该赛题使用纯强化学习指标Reward进行评分。
4 赛题赛程
2021年8月31日:提交最终结果的截止日期。
2021年9月5日:发送技术报告的截止日期,比赛结束,
2021年9月12日:发布最终结果,并邀请优秀团队提交论文(发表在IEEE BigData 2021关联的Workshop)。
2021年10月10日:提交受邀论文的截止日期,
2021年10月25日:接受书面通知,
2021年11月15日:接受论文的camera-ready时间。
5 赛题奖励
赛题1:商品组合购买概率预测
· 冠军:一支队伍,奖金1000美元;
· 亚军:一支队伍,奖金500美元;
排名前二的队伍将免费获得IEEE BigData2021会议的注册门票;
排名前五的队伍将获得优先实习或者直通面试的机会。
赛道2:商品组合生成
· 冠军:一支队伍,奖金1000美元;
· 亚军:一支队伍,奖金500美元;
排名前二的队伍将免费获得IEEE BigData2021会议的注册门票;
排名前五的队伍将获得优先实习或者直通面试的机会。
我们将邀请优秀的竞赛报告的作者扩展他们的报告(经组委会成员审查后)并在IEEE BigData2021会议上发表。
6 赛题准备
由于本次比赛是基于强化学习,所以可能会用到的库包括:
· rllib:最常用的强化学习算法库。
· tianshou:清华大学开发的强化学习算法库。
结合赛题的内容,这里推荐两篇推荐系统结合深度学习、强化学习的综述论文,以及两篇容易复现的论文。
• Deep learning based recommender system: A survey and new perspectives
• Reinforcement learning based recommender systems: A survey
• Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems
• Virtual-Taobao: Virtualizing Real-world Online Retail Environment for Reinforcement Learning https://github.com/eyounx/VirtualTaobao
心动不如行动,有兴趣的小伙伴,请赶快点击下方的链接或“阅读全文”报名吧!
http://bigdataieee.org/BigData2021/BigDataCupChallenges.html
kaggle链接:
https://www.kaggle.com/c/bigdata2021-rl-recsys/overview