OneRec – 快手推出的端到端生成式推荐系统

OneRec – 快手推出的端到端生成式推荐系统

4.8
0热度

OneRec是什么OneRec 是快手推出的新型端到端生成式推荐系统。采用编码器-解码器架构,通过稀疏 Mixture-of-Experts(MoE)技术提升模型容量,保持高效的计算性能。与传统级联推荐系统不同,OneRec 使用会话式生成方法,能生成上下文连贯的推荐结果,通过迭代偏好对齐模块结合直接偏好优化(DPO),进一步提升推荐质量。在训练过程中,OneRec 将多模态表征量化为 tok

OneRec是什么

OneRec 是快手推出的新型端到端生成式推荐系统。采用编码器-解码器架构,通过稀疏 Mixture-of-Experts(MoE)技术提升模型容量,保持高效的计算性能。与传统级联推荐系统不同,OneRec 使用会话式生成方法,能生成上下文连贯的推荐结果,通过迭代偏好对齐模块结合直接偏好优化(DPO),进一步提升推荐质量。在训练过程中,OneRec 将多模态表征量化为 token 序列输入模型,采用两阶段训练策略:先进行基础的 item 预测任务训练,再通过 DPO 进行偏好对齐。

OneRec

OneRec的主要功能

  • 端到端生成式架构:OneRec 采用编码器-解码器架构,将推荐问题转化为序列生成任务。编码器整合用户的历史行为序列,解码器通过稀疏混合专家(MoE)架构逐步生成用户可能感兴趣的视频。
  • 会话式生成方法:与传统的逐点预测不同,OneRec 提出会话式生成方法,能生成整个推荐列表,更好地捕捉上下文信息。
  • 实验验证与效果提升:OneRec 在快手平台的在线 A/B 测试中实现了 1.6% 的观看时间提升,显著优于传统方法。

OneRec的技术原理

  • 编码器-解码器架构:neRec 采用 Encoder-Decoder 架构,将推荐问题转化为序列生成任务。编码器负责将用户的全生命周期行为序列压缩成兴趣向量,解码器则通过稀疏混合专家(MoE)架构逐步生成用户可能感兴趣的视频。能更好地捕捉用户兴趣的变化,并生成连贯的推荐列表。
  • 多模态分词器:OneRec 首创了协同感知的多模态分词方案,融合视频的标题、标签、语音转文字、图像识别等多维信息,转化为分层的语义 ID。能更精准地建模用户兴趣。
  • 强化学习偏好对齐:OneRec 引入了基于奖励机制的偏好对齐方法,通过强化学习增强模型效果。模型利用偏好奖励、格式奖励和业务奖励构建综合奖励系统,优化生成结果。能使模型更好地感知用户的细粒度偏好,提升推荐的精准度。
  • 性能优化:OneRec 通过架构重构,将关键算子数量大幅压缩,通过稀疏 MoE 架构扩展模型容量,显著提升了计算效率。通过训练和推理优化,实现了更高的模型浮点运算利用率(MFU),使得算力效率大幅提升。

OneRec的项目地址

  • arXiv技术论文:https://export.arxiv.org/pdf/2502.18965

OneRec的应用场景

  • 短视频推荐:OneRec 在快手的短视频推荐主场景中表现突出,承担了约 25% 的请求(QPS)。通过生成式架构和强化学习偏好对齐,OneRec 在用户停留时长、点赞、关注、评论等交互指标上均取得了显著提升。
  • 本地生活服务:OneRec 在快手的本地生活服务场景中也取得了显著成效。AB 对比实验表明,推动了交易总额(GMV)增长 21.01%,订单量提升 17.89%,购买用户数增长 18.58%,新客获取效率提升了 23.02%。
  • 直播内容匹配:OneRec 被应用于直播内容匹配,通过动态生成推荐序列,能更好地匹配用户的实时兴趣,提升用户在直播场景中的参与度和互动率。
  • 广告投放:在广告投放领域,OneRec 的生成式架构能根据用户的兴趣和行为动态生成广告推荐,提高广告的精准度和转化率。

首页 发现
看过 我的