← 返回报告列表

2026-W20 周报

周报 📅 2026-05-11 ~ 2026-05-17
Semantic ID 生成式推荐工业化全栈推进,LLM 缩放与几何理论并行深化
semantic-id industrial rl quantization parameter-scaling cold-start
📊 共 39 篇 · 精读 18

2026-W20 周报

日期范围: 2026-05-11 ~ 2026-05-17

主题: Semantic ID 生成式推荐工业化全栈推进,LLM 缩放与几何理论并行深化

标签: semantic-id · industrial · rl · quantization · parameter-scaling · cold-start

📊 统计: 共 39 篇 · 精读 18 · 覆盖 4 个工作日

周度综述

本周 4 份日报共收录约 39 篇论文、精读 18 篇,类别上生成式推荐占据绝对主线,判别式推荐、LLM 推荐与缩放/几何理论分列其后;工业界(快手、百度、美团、腾讯、阿里、蚂蚁、小红书)与学术机构产出大致各半。三条技术趋势贯穿全周:其一,Semantic ID 量化范式加速工业化,并沿“非对称表示—可变长编码—排序召回统一”分化——腾讯 AsymRec 以连续-离散非对称框架(MSP+MHQ)破解 popularity-bias 与 dimensional-collapse 双瓶颈,NDCG@10 平均 +15.8%;华东师大 VarLenRec 用双曲自适应残差量化将碰撞率从 12.7% 降至 3.2%;美团 DIG 把 RQ tokenizer 嵌入判别式排序器实现同模型排序+检索,R@10 增益 +52%~+220%。其二,RL 与 latent reasoning 在生成式推荐中走向稳态化:百度 LASAR 首次完整移植 Coconut 风格递归隐状态推理,近 SOTA 且较显式 CoT 快约 20×;UVA SAPO 把信用分配下沉到 reasoning step 粒度;阿里 CQ-SID 用 EG-GRPO 缓解稀疏奖励坍塌,单链路贡献全平台 72.63% 购买。其三,理论侧把“scaling”从经验拟合推向可解释边界:Arena Physica 的 Practical Scaling Laws 以 8 参数闭式将外推 RMSE 平均降低 49%,Geometric Wall 用 Fisher-Rao 信息几何解释 SAE 重构的层级差异。工业落地亮点密集:快手 UxSID 以 target SID 路由实现超长序列 O(1) 在线推理,4 亿用户广告 A/B +0.337% Revenue;阿里 GrowthGR 以反事实 uplift+多价值 GRPO 两月新品 GMV +5.39%;蚂蚁 MaskTab 建立表格预训练三轴 scaling law、CreditRisk +5.04% AUC;港理工 Ghost 治理 tail token 梯度饥饿、Tail HR +63.91%。整体看,Semantic ID 工业化与 latent reasoning、manifold-aware scaling 的交叉最值得持续关注。

每日概览

2026-05-12

  • 主题: 工业级推荐系统全栈突破与 LLM 缩放/几何理论双线深化
  • 论文数: 10 · 精读: 6

2026-05-13

  • 主题: 生成式推荐多路径演进与工业级表格预训练并举
  • 论文数: 11 · 精读: 3

2026-05-15

  • 主题: Semantic ID 驱动的生成式推荐工业化与排序-召回统一
  • 论文数: 6 · 精读: 3

2026-05-19

  • 主题: 生成式推荐多维突破:冷启动、长尾去偏与可变长 SID
  • 论文数: 12 · 精读: 6