Yandex开源音乐推荐巨量数据集Yambda,助力智能音乐服务创新
发布时间:2025-05-30 15:11:07 浏览量:2
俄罗斯搜索引擎巨头Yandex近日宣布了一项重大开源贡献,推出了一款名为Yambda的音乐推荐系统数据集,该数据集规模空前,旨在助力开发者打造更智能的音乐服务。
据了解,Yambda数据集汇聚了近2800万Yandex Music月度用户在十个月内的交互信息,涵盖了939万首歌曲的479亿次互动记录。这些记录详细反映了用户对歌曲的偏好与反馈,且每条记录都标记有时间戳,以确保数据的准确性和时效性。
Yandex表示,Yambda数据集不仅包含了用户对歌曲的喜好信息,更重要的是,它提供了关于用户行为模式的深度洞察。这些数据对于开发智能音乐推荐系统来说,无疑是一笔宝贵的财富。
为了满足不同开发者的需求,Yambda数据集在Hugging Face平台上提供了三种不同规模的选择:Yambda-5B、Yambda-500M和Yambda-50M。其中,规模最大的Yambda-5B数据集包含了来自100万名用户的交互行为,其数据量之大,至少需要85GB的存储空间。
这一开源举措无疑将极大地推动音乐推荐系统的发展。开发者们可以基于Yambda数据集,训练和优化自己的音乐推荐算法,从而提供更加个性化、精准的音乐推荐服务。
Yandex的这一贡献不仅体现了其在技术领域的领先地位,也彰显了其对开源社区的积极支持。随着Yambda数据集的广泛应用,我们有理由相信,未来的音乐推荐系统将更加智能、更加贴心。