← 返回报告列表

2026-04 月报

月报 📅 2026-04-01 ~ 2026-04-30
生成式推荐工业化与判别式排序结构性 scaling 双线突破
generative-retrieval semantic-id industrial scaling rl sequential-rec llm-based ctr-prediction
📊 共 106 篇 · 精读 37

2026-04 月报

日期范围: 2026-04-01 ~ 2026-04-30

主题: 生成式推荐工业化与判别式排序结构性 scaling 双线突破

📊 统计: 共 106 篇 · 精读 37

类别分布: - 其他: 16 篇 - 生成式推荐: 23 篇 - LLM: 28 篇 - 判别式推荐: 41 篇

月度综述

本月概览

2026 年 4 月共纳入推荐系统相关 ArXiv 论文 106 篇,其中精读 37 篇(精读率约 35%)。类别分布上,判别式推荐 41 篇(39%)位居首位,LLM 推荐 28 篇(26%)、生成式推荐 23 篇(22%)、其他 16 篇(13%)。从来源看,工业界论文占比明显高于历史均值,腾讯、美团、阿里、字节、快手、京东、华为、苹果、Snapchat、Zalando 等头部公司密集贡献了带线上 A/B 验证的系统级工作,是近年工业落地密度最高的一个月。

最热研究方向

方向一:生成式推荐进入工业系统化部署期。 这是本月最显著的转折。阿里 STAMP 用双端语义稀疏化(输入 SAP + 输出 MAP)解决 SID-GR 的 Semantic Dilution,1.23–1.38× 提速 + 17–55% 显存节省;美团 NSGR 以树形 next-scale 生成式重排把候选集复杂度压至 log₂(m),外卖 8 周 A/B 取得 +2.89% CTR / +3.15% GMV;京东 GenRec 系统性回应训练信号稀疏(页粒度 NTP)、SID 序列过长(非对称 Token Merger)、偏好不对齐(GRPO-SR)三大瓶颈,30 天 A/B 点击 +9.5% / 成交 +8.7%。快手 AdaSID 把 SID 碰撞处理升级为"语义豁免 + 自适应压力分配",A/B GMV +0.98%;美团 Pro-GEO 把 RoPE 从序列推广到空间域,地理聚类距离降低 45.6%。

方向二:工业判别式排序的结构性 scaling。 AliExpress SSR 以显式稀疏交互取代 Wukong/RankMixer 的密集架构,亿级数据复现真实 scaling law;腾讯 RankUp 从"有效秩"视角解决 MetaFormer 表征坍缩,微信广告三场景 GMV +3.41–4.81%;美团 SIF 把序列粒度从 item-level 升级到 sample-level;阿里 LoopCTR 将共享层递归复用立为正交于深/宽/输入的第四种 scaling 维度,train-multi-loop / infer-zero-loop;快手 CS3 在双塔召回中嵌入三个即插即用模块,广告收入 +8.36% 而 QPS 开销 <1%。字节 IAT 把全量行为压缩为实例 token,三场景完成部署。

方向三:LLM 推荐从端到端微调走向 RL 推理增强与离线赋能。 华为 ReCast 把 RL 瓶颈前推至"group 可学性退化",用 ground-truth anchor 修复全零组;阿里 Qwen 团队 ResRank 用 Encoder-LLM 把段落压成单 embedding 残差喂给 Reranker-LLM,零生成 token 逼近 GPT-4 的 BEIR/TREC DL 效果;Meta×USTC TAWin 形式化证明 GRPO+二值奖励等价于 AUC,可微 soft 窗口跨 backbone 一致 SOTA;美团 LongCat 的 FLR 将单向量 latent reasoning 解耦为 K 个偏好因子。

方向四:长序列 KV 压缩与 SID 自适应。 快手 KSA 用可学习 summary token 实现 O(n/k) 语义级 KV 压缩,与 GQA/MLA 正交可叠加 8×,RULER-128K 上 hybrid-KSA 比 Hybrid-GDN 高 +5.48/+3.69 分;推荐域的 Token Merger、SAP/MAP、AdaSID 与 LLM 长上下文压缩呈方法同源。

方向五:评测可信度反思。 SSS-Audit 复现 17 篇 SR 顶会论文,发现 10 篇隐式使用 Sub-Sequence Splitting,去除该数据泄漏后 8/10 模型性能跌至 SASRec 以下 20–55%,对当前序列推荐评测体系提出严肃质疑。

工业落地亮点

带规模 A/B 的工作密集涌现:京东 GenRec(点击 +9.5%)、美团 NSGR(GMV +3.15%)、腾讯 RankUp(GMV +3.41–4.81%)、快手 CS3(广告收入 +8.36%)、快手 AdaSID(GMV +0.98%)、Zalando LTE(嵌入漂移消除带正向收益)、字节 IAT(电商广告/购物中心/直播电商三场景)。

未来值得关注的趋势

(1)SID 从静态量化走向"语义/空间/负载自适应",与 LLM 长上下文 KV 压缩方法同源;(2)RL 在推荐和检索重排中的目标设计正从启发式走向 AUC/OPAUC 等理论刻画;(3)"结构性 scaling + 边界式 RL 信号 + LLM 离线赋能"三股力量正构成工业可落地推荐系统的新范式;(4)腾讯 TencentGR-1M/10M 等首个工业级生成式推荐公开数据集的出现,将加速学界与工业界对齐评测。

周度回顾

2026-W15

  • 生成式推荐工业化落地与序列建模规模化双线并进
  • 论文 28 篇

2026-W16

  • 生成式推荐工业落地与序列建模统一框架的双轨并进
  • 论文 9 篇

2026-W17

  • 工业排序结构性 scaling 与 RL/LLM 生成式推荐双线并进
  • 论文 29 篇

每日索引

  • 2026-04-06 — Semantic ID 与生成式推荐工业实践 (14 篇)
  • 2026-04-07 — 生成式推荐的去偏、加速与检索增强 (4 篇)
  • 2026-04-08 — 生成式推荐工业落地与序列推荐评测反思 (10 篇)
  • 2026-04-09 — 冷启动与 persona 建模成为今日推荐议题主线 (2 篇)
  • 2026-04-10 — 工业级生成式与判别式推荐双线突破:可扩展稀疏 + 稳定嵌入 (7 篇)
  • 2026-04-13 — 工业级用户行为序列建模与学术推荐表示优化并行推进 (5 篇)
  • 2026-04-16 — 序列推荐统一建模与时序特征工程的多路并进 (8 篇)
  • 2026-04-17 — 工业级生成式推荐:训练信号、序列压缩与强化对齐 (1 篇)
  • 2026-04-21 — 工业排序表征质量提升与生成式推荐理论基础双线并进 (12 篇)
  • 2026-04-22 — 工业级推荐系统的结构创新与 scaling 新维度 (7 篇)
  • 2026-04-23 — LLM 自博弈扩展与 Agent 记忆结构化生成 (2 篇)
  • 2026-04-24 — LLM 离线知识蒸馏赋能传统序列推荐 (1 篇)
  • 2026-04-27 — RL 重塑 LLM 生成式推荐与检索重排 (7 篇)
  • 2026-04-28 — Semantic ID 工业落地与长序列 KV 压缩双线推进 (16 篇)
  • 2026-04-30 — 生成式与 LLM 推荐:语义 ID、压缩重排与因子化潜推理 (8 篇)
  • 2026-05-01 — LLM 生成式推荐的推理加速与列表重排 (2 篇)