2026-04-08 日报
主题: 生成式推荐工业落地与序列推荐评测反思
标签: generative-retrieval · sequential-rec · semantic-id · industrial · diffusion
📊 统计: 共 10 篇 · 精读 4 · 🏢 工业界 2 · 🎓 学术 8 · discriminative-rec 3 · generative-rec 4 · llm 2 · other 1
综述
本期日报覆盖 2026-04-07 ArXiv 提交,共 10 篇推荐相关论文(4 篇精读 + 6 篇摘要归档)。两篇高分工业论文聚焦生成式推荐落地:阿里 STAMP 提出双端语义稀疏化(输入 SAP + 输出 MAP)解决 SID-GR 的 Semantic Dilution 问题,1.23-1.38× 提速 + 17-55% 显存节省;美团 NSGR 用基于树的 next-scale 生成式重排(log₂(m) 复杂度),美团外卖 8 周 A/B 实现 +2.89% CTR / +3.15% GMV / +0.58% CVR。学术方向 LGCD 借助 Baichuan2-7B LLM 生成跨域伪交互 + 条件扩散 + MoE 解决跨域冷启动,HR@5 提升 14-35%。值得警惕的是 SSS-Audit 复现研究审计 17 篇 SR 顶会论文,发现 10/17 在代码中悄悄使用 Sub-Sequence Splitting 但论文未声明,去除 SSS 后 8/10 模型性能掉到 SASRec 之下 20-55%,呼吁回归诚实的 SASRec baseline。整体趋势:生成式推荐工业部署密度持续上升,同时学界对 SR 评测协议的反思开始浮现。
重点论文
NSGR · ⭐ 8/10
Next-Scale Generative Reranking: A Tree-based Generative Rerank Method at Meituan
🏢 Meituan · 生成式推荐
NSGR 提出 tree-based 的 next-scale 生成式重排框架,用 log2(m) 步粗到细二分替代逐位自回归或一次性生成,并通过 Multi-Scale Evaluator 与 Multi-Scale Neighbor Loss 解决生成器-评估器目标错位,在美团食品配送线上 A/B 取得 CTR +2.89% / GMV +3.15% 的提升。
STAMP · ⭐ 8/10
STAMP: Semantic Trimming and Auxiliary Multi-step Prediction for Generative Recommendation
🏢 Alibaba · 生成式推荐
针对 Semantic ID 生成式推荐的训练加速框架:SAP 依据语义显著性与注意力中心性在 Transformer 中层剪枝冗余 token,MAP 通过多步前瞻预测增稠监督信号,在 T5 与 Qwen 双架构上实现 1.23-1.38x 加速与 17-55% VRAM 节省,同时保持甚至提升推荐精度。
SSS-Audit · ⭐ 7/10
Pay Attention to Sequence Split: Uncovering the Impacts of Sub-Sequence Splitting
🎓 学术 · 判别式推荐
系统性审计研究揭示 Sub-Sequence Splitting(SSS)在 2022-2026 年 17 篇 SR 论文中大量未披露地启用,导致新模型提升被错误归因于架构创新;移除 SSS 后 8/10 的 SOTA 模型回退 40% 并输给 2018 年的 SASRec;提供 Single-target+CE+Prefix/Suffix 作为 SR 评测的推荐配置。
LGCD · ⭐ 7/10
From Clues to Generation: Language-Guided Conditional Diffusion for Cross-Domain Recommendation
🎓 学术 · 生成式推荐
LGCD 用 LLM 为单域用户生成目标域的 pseudo-overlapping 交互,再通过 cross-attention 条件扩散模型 + MoE 融合从源域生成目标域用户偏好表征,解决 inter-domain 跨域推荐中 overlapping users 稀缺的冷启动问题。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| NSGR | Next-Scale Generative Reranking: A Tree-based Generative Rerank Method at Meituan | 生成式 | 🏢 Meituan | 8 | 8 |
| STAMP | STAMP: Semantic Trimming and Auxiliary Multi-step Prediction for Generative Recommendation | 生成式 | 🏢 Alibaba | 8 | 8 |
| SSS-Audit | Pay Attention to Sequence Split: Uncovering the Impacts of Sub-Sequence Splitting | 判别式 | 🎓 学术 | 7 | 7 |
| LGCD | From Clues to Generation: Language-Guided Conditional Diffusion for Cross-Domain Recommendation | 生成式 | 🎓 学术 | 7 | 7 |
| — | Generative Retrieval Overcomes Limitations of Dense Retrieval but Struggles with Identifier Ambiguity | 生成式 | 🎓 学术 | 6 | — |
| — | Retrieve-then-Adapt: Retrieval-Augmented Test-Time Adaptation for Sequential Recommendation | 判别式 | 🎓 学术 | 6 | — |
| — | The Unreasonable Effectiveness of Data for Recommender Systems | 判别式 | 🎓 学术 | 5 | — |
| — | When Do We Need LLMs? A Diagnostic for Language-Driven Bandits | LLM | 🎓 学术 | 5 | — |
| — | Curr-RLCER: Curriculum Reinforcement Learning For Coherence Explainable Recommendation | LLM | 🎓 学术 | 5 | — |
| — | Masking or Mitigating? Deconstructing the Impact of Query Rewriting on Retriever Biases in RAG | 其他 | 🎓 学术 | 4 | — |