← 返回报告列表

2026-05 月报

月报 📅 2026-05-01 ~ 2026-05-31
推荐系统全面工业化:Semantic ID、多维 Scaling 与生成式建模三线并进
semantic-id industrial parameter-scaling quantization rl test-time-training cold-start pretrained-lm
📊 共 147 篇 · 精读 59

2026-05 月报

日期范围: 2026-05-01 ~ 2026-05-31

主题: 推荐系统全面工业化:Semantic ID、多维 Scaling 与生成式建模三线并进

📊 统计: 共 147 篇 · 精读 59

类别分布: - 判别式推荐: 52 篇 - 生成式推荐: 32 篇 - LLM: 41 篇 - 其他: 29 篇

月度综述

本月共收录 147 篇论文、精读 59 篇;类别上判别式推荐(52)居首,LLM(41)、生成式推荐(32)与其他(29)并行,而精读名额几乎被工业界包揽,学术工作多见于略读——"产业落地"构成本月压倒性基调。

主线一:Semantic ID 量化范式全面工业化,并沿多条路径分化。腾讯 AsymRec 以连续-离散非对称框架破解 popularity-bias 与 dimensional-collapse,NDCG@10 平均 +15.8%;美团 DIG 把 RQ tokenizer 嵌入判别式排序器实现同模型 "排序+检索",R@10 增益 +52%~+220%;阿里 CQ-SID 用类目约束簇式 SID 单链路贡献全平台 72.63% 购买;华东师大 VarLenRec 以双曲自适应残差量化把碰撞率从 12.7% 降至 3.2%;Pinterest PrefixMem 把 SID 视作需专用编码器的 "模态",稀有物品准确率相对提升 115%;LinkedIn RQ-FSQ 首证跨域 viewer Semantic ID。

主线二:Scaling 从 "能否扩" 转向 "如何在算力约束下落地",并新增 "测试时扩展" 维度。ByteDance InfoLaw 把训练重写为信息累积、外推 7B 误差仅 0.15%;Arena Physica 给出 8 参数闭式 scaling law、外推 RMSE 平均降低 49%;Netflix 把生成式骨干从 2M 扩到 1B、冷启动 +28.1%;Coupang 把搜索 CVR 缩放拆为 backbone/embedding/data 三维且收益可加;ByteDance Rec-Distill 以 "教师收益×可迁移性" 蒸馏 24B 教师。测试时侧,阿里 UTTSI 作为首个免训练、模型无关框架线上 +5.3% CTR,DeGRe 生成式重排淘宝闪购 GMV +3.75%。

主线三:生成式推荐沿 latent reasoning、价值对齐与分布建模深耕。百度 LASAR 首次完整移植 Coconut 风格递归隐状态推理、较显式 CoT 快约 20×;UCSD/Snap 的 Latte 用前置 latent token 突破自回归 SID 的表达力上限(NDCG@10 +3.45%);腾讯 UniVA 把价值对齐贯穿分词-解码-PPO、线上 GMV +1.50%;快手 FlowTime 以条件 Normalizing Flow 把高斯先验 warp 成个性化多峰分布、播放时长 +1.044%;阿里 GrowthGR 以反事实 uplift 加多价值 GRPO 两月新品 GMV +5.39%。

公司动态上,阿里最为活跃(CapsID、CQ-SID、GrowthGR、AKT-Rec、UTTSI、DeGRe、HLEM 调度),快手(UxSID、PEARL、RPORec、DADF、FlowTime)、腾讯(UniVA、AsymRec、SIREN)、Pinterest(UniPinRec、PrefixMem)与 ByteDance(InfoLaw、Rec-Distill)紧随其后,Meta、Baidu、LinkedIn、Meituan、Netflix 亦各有代表作。架构层面,Pinterest UniPinRec 作为首个全栈统一检索与排序的生产系统(互动 +1%、端到端延迟 -11.1%、QPS +63.6%)是本月最具系统价值的工作;快手 UxSID 以 target SID 路由实现超长序列 O(1) 在线推理(4 亿用户广告 A/B +0.337% Revenue)亦极具工程含金量。

值得警醒的是 Airbnb/MSU 的 TGH:一个免训练图启发式审计了覆盖 87% 近期生成式推荐论文的 Amazon 基准、NDCG@10 反超 SOTA 17–44%,对整个评测体系敲响警钟。未来值得关注:latent reasoning 与 manifold-aware scaling 的交叉、测试时计算扩展的常态化,以及 Semantic ID 作为独立 "模态" 的专用编码与跨域迁移。

周度回顾

2026-W19

  • 生成式推荐全栈深耕与 Scaling Law 理论双主线深化
  • 论文 38 篇

2026-W20

  • Semantic ID 生成式推荐工业化全栈推进,LLM 缩放与几何理论并行深化
  • 论文 39 篇

2026-W21

  • 工业推荐规模化:参数与测试时双轴扩展,语义 ID 与长尾冷启动
  • 论文 50 篇

2026-W22

  • 工业推荐全面落地:Semantic ID 量化、参数缩放与生成式建模三线并进
  • 论文 54 篇

每日索引

  • 2026-05-04 — 推荐系统负样本挖掘与多模态鲁棒性 (3 篇)
  • 2026-05-05 — Scaling Laws 三连发与领域 Foundation Model 实践 (9 篇)
  • 2026-05-06 — AI 生成音乐流行度预测与 Agentic 工作流编排 (2 篇)
  • 2026-05-07 — 生成式推荐与服务系统全栈优化:Semantic ID、对齐与 HBM 调度协同推进 (6 篇)
  • 2026-05-08 — 生成式推荐表达力与价值对齐双线突破 (6 篇)
  • 2026-05-11 — 生成式推荐基准审计与对话式语义ID落地 (5 篇)
  • 2026-05-12 — 工业级推荐系统全栈突破与 LLM 缩放/几何理论双线深化 (10 篇)
  • 2026-05-13 — 生成式推荐多路径演进与工业级表格预训练并举 (11 篇)
  • 2026-05-15 — Semantic ID 驱动的生成式推荐工业化与排序-召回统一 (6 篇)
  • 2026-05-19 — 生成式推荐多维突破:冷启动、长尾去偏与可变长 SID (12 篇)
  • 2026-05-20 — 向量量化双线推进,推荐与推理理论同台 (4 篇)
  • 2026-05-21 — 工业直播推荐新范式与 LLM 训练标度律 (6 篇)
  • 2026-05-22 — LLM 显式推理与生成式检索重塑推荐召回 (5 篇)
  • 2026-05-25 — 工业推荐的规模化扩展与长尾冷启动 (8 篇)
  • 2026-05-26 — 工业推荐系统:测试时扩展、生成式重排与效率优化 (15 篇)
  • 2026-05-27 — 端侧 MoE 推理提效与工业级推荐流量治理 (5 篇)
  • 2026-05-28 — LLM 与世界模型驱动推荐:工业落地与偏好对齐 (6 篇)
  • 2026-05-29 — 工业推荐与搜索排序的参数缩放及高效落地 (4 篇)
  • 2026-06-01 — 工业级推荐:统一检索排序架构与 Semantic ID 编码 (9 篇)
  • 2026-06-02 — 工业级推荐落地:Semantic ID 量化与生成式建模双线突破 (15 篇)