← 返回报告列表

2026-04-17 日报

日报 📅 2026-04-16
工业级生成式推荐:训练信号、序列压缩与强化对齐
generative-retrieval semantic-id rl sequential-rec industrial
📊 共 1 篇 · 精读 1

2026-04-17 日报

主题: 工业级生成式推荐:训练信号、序列压缩与强化对齐

标签: generative-retrieval · semantic-id · rl · sequential-rec · industrial

📊 统计: 共 1 篇 · 精读 1 · 🏢 工业界 1 · 🎓 学术 0 · generative-rec 1

综述

2026年4月17日共收录1篇论文,类别集中于生成式推荐(generative-rec),来自工业界。

重点论文 GenRec(京东)系统性回应了大规模生成式检索在工业部署中的三大核心瓶颈:(1)训练信号稀疏——提出页粒度 NTP(Page-wise Next-Token Prediction),将有效训练信号密度显著提升;(2)语义ID序列过长——设计非对称 Token Merger,以约2倍压缩比缩短输入序列,同时保留语义区分能力;(3)生成结果与用户偏好不对齐——提出 GRPO-SR,将 Group Relative Policy Optimization 与点击率、成交率混合奖励结合,实现偏好导向的强化学习对齐。线上 A/B 实验(30天)显示点击提升 +9.5%、成交提升 +8.7%,是近期工业生成式推荐中效果增益较为显著的系统性工作。

从技术趋势看,GenRec 的实践印证了生成式推荐走向工业落地的三个关键方向:更致密的序列级监督信号、轻量化的 ID 表征压缩,以及以业务指标为奖励的 RL 对齐。后续值得关注的方向包括:Token Merger 的无损压缩下界、GRPO 在探索-利用权衡上的稳定性,以及多业务场景下偏好奖励的泛化能力。

重点论文

GenRec · ⭐ 8/10

GenRec: A Preference-Oriented Generative Framework for Large-Scale Recommendation

🏢 JD · 生成式推荐

JD.com 推出的偏好对齐生成式推荐框架,以 Page-wise NTP 解决分页场景的标签歧义,Token Merger 将 SID prompt 压缩 2× 不损精度,GRPO-SR 用 hybrid rewards 抑制 reward hacking,JD App 首页 feed 全量上线后点击数 +9.5%、成交数 +8.7%。

全部论文

模型 标题 类别 公司 摘要分 精读分
GenRec GenRec: A Preference-Oriented Generative Framework for Large-Scale Recommendation 生成式 🏢 JD 9 8