知乎联合清华开放国内最大个性化推荐实际交互数据集
2021-10-20 12:52:44 来源:
5月21日,知乎联合清华大学对外开放基于知乎的大规模富文本查询和推荐数据集ZhihuRec。该数据集包含了知乎上的1亿个行为数据,是目前为止,国内用于个性化推荐的最大的实际交互数据集。
作为一个大型数据集,ZhihuRec具有社交化问答场景中的详细信息,覆盖了知乎10天内、79。8万用户、16。5万个问题、55。4万个回答、24万个作者、7万线万用户搜索行为日志,保留了完整的用户交互(例如点击、跳过、搜索等)、时机和内容信息,且所有数据均经过脱敏处理。
该数据集可用于评估常规top-N推荐、顺序推荐和上下文感知推荐中的算法应用,还可用于集成搜索和推荐以及带有负反馈的推荐。 此外,该数据集不仅可以用于推荐研究,还可以应用于用户建模(例如,性别预测,用户兴趣预测),搜索和推荐系统的组合以及其他有趣的主题。
个性化推荐技术已经广泛应用于购物、视频、阅读、社交等互联网场景。但开放式大规模真实场景数据集十分罕有。ZhihuRec数据集的开放,不仅丰富了开放式大规模真实场景数据集的研究样本,更填补了推荐系统中用户交互日志的空白。
知乎成立十年来,聚集了超过3 。53亿条内容,每天会新增超过2000万条创作和互动,为中文互联网贡献了宝贵的文本财富。
2018年,知乎曾联合中国信息检索学术会议(CCIR)、清华大学计算机系信息检索课题组(THUIR)共同举办了移动环境下知识分享平台上的内容推荐大赛,首次在比赛中开放ZhihuRec数据集,吸引了众多高校和企业技术团队参赛和关注。此次知乎联合清华大学将该数据集进一步丰富并全面开放,旨在通过更大范围的数据开源,为行业算法技术突破与演进提供更多数据和场景支持。
-
知乎联合清华开放国内最大个性化推荐实际交互数据集
5月21日,知乎联合清华大学对外开放基于知乎的大规模富文本查询和推荐数据集ZhihuRec。该数据集包含了知乎上的1亿个行为数据,是目前为止
2021-10-20 12:52
-
集邮吗?特种邮票在温江首发!
10月15日,《交通可持续发展》特种邮票在温江首发。来自全国各地的集邮爱好者前往四川交通职业技术学院参加了首发仪式,并参观了建党100周
2021-10-20 08:28
-
荣耀智慧屏再获行业认可,领先性能+创新功能助推入选电子视像产
1月15日,由奥维云网主办的第54届中国智能显示与创新应用产业大会暨CRC2019年度彩电行业研究发布会在北京成功召开,本次大会以全场景串联
2021-10-20 06:04
-
买家电,安装还得花钱?选卡萨帝,设计、拆装、局改都免费!
买家电都有哪些坑?二次消费算是大家诟病比较多的一个槽点了。明明已经花钱买了家电,等到安装时却还要再掏一次钱,这样的套路让不少用
2021-10-20 04:12
-
新版贺年专用邮票——“贺十六”【自提】时间确定
从2006年开始,中国邮政开始发行贺年专用邮票,用以庆贺新年的到来,不知不觉之间,其不仅自成系列,并且已经走过十五度春秋 在2022年
2021-10-20 03:27
-
国球的老故事:从邮票看中国乒乓球运动的兴衰史?
乒乓球之所以成为国球,在于它在新中国,体育史上的独特地位,这一点从中国过去60年的邮票就可以看出来。 1959年,第25届世界乒乓球锦
2021-10-20 01:31