2026-04-17 日报
主题: 工业级生成式推荐:训练信号、序列压缩与强化对齐
标签: generative-retrieval · semantic-id · rl · sequential-rec · industrial
📊 统计: 共 1 篇 · 精读 1 · 🏢 工业界 1 · 🎓 学术 0 · generative-rec 1
综述
2026年4月17日共收录1篇论文,类别集中于生成式推荐(generative-rec),来自工业界。
重点论文 GenRec(京东)系统性回应了大规模生成式检索在工业部署中的三大核心瓶颈:(1)训练信号稀疏——提出页粒度 NTP(Page-wise Next-Token Prediction),将有效训练信号密度显著提升;(2)语义ID序列过长——设计非对称 Token Merger,以约2倍压缩比缩短输入序列,同时保留语义区分能力;(3)生成结果与用户偏好不对齐——提出 GRPO-SR,将 Group Relative Policy Optimization 与点击率、成交率混合奖励结合,实现偏好导向的强化学习对齐。线上 A/B 实验(30天)显示点击提升 +9.5%、成交提升 +8.7%,是近期工业生成式推荐中效果增益较为显著的系统性工作。
从技术趋势看,GenRec 的实践印证了生成式推荐走向工业落地的三个关键方向:更致密的序列级监督信号、轻量化的 ID 表征压缩,以及以业务指标为奖励的 RL 对齐。后续值得关注的方向包括:Token Merger 的无损压缩下界、GRPO 在探索-利用权衡上的稳定性,以及多业务场景下偏好奖励的泛化能力。
重点论文
GenRec · ⭐ 8/10
GenRec: A Preference-Oriented Generative Framework for Large-Scale Recommendation
🏢 JD · 生成式推荐
JD.com 推出的偏好对齐生成式推荐框架,以 Page-wise NTP 解决分页场景的标签歧义,Token Merger 将 SID prompt 压缩 2× 不损精度,GRPO-SR 用 hybrid rewards 抑制 reward hacking,JD App 首页 feed 全量上线后点击数 +9.5%、成交数 +8.7%。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| GenRec | GenRec: A Preference-Oriented Generative Framework for Large-Scale Recommendation | 生成式 | 🏢 JD | 9 | 8 |