← 返回报告列表

2026-W19 周报

周报 📅 2026-05-04 ~ 2026-05-10
生成式推荐全栈深耕与 Scaling Law 理论双主线深化
semantic-id parameter-scaling industrial pretrained-lm rl academic
📊 共 38 篇 · 精读 20

2026-W19 周报

日期范围: 2026-05-04 ~ 2026-05-10

主题: 生成式推荐全栈深耕与 Scaling Law 理论双主线深化

标签: semantic-id · parameter-scaling · industrial · pretrained-lm · rl · academic

📊 统计: 共 38 篇 · 精读 20 · 覆盖 6 个工作日

周度综述

本周共收录 38 篇论文(约 20 篇精读),覆盖 LLM/Scaling、生成式推荐、判别式推荐与系统/检索四大块,工业界(ByteDance、Meta、Tencent、Alibaba、Kuaishou、Baidu、小红书、Airbnb)与学术界(Cornell、Yale、UCSD、MSU)贡献基本对半。两条主线贯穿全周。其一是 Scaling Law 从经验拟合迈向“可解释、可指导 recipe”的阶段:ByteDance 的“InfoLaw”把训练重写为信息累积过程,将 mixture×scale×repetition 坍缩到统一幂律,外推 7B 误差仅 0.15%;Arena Physica 的“Practical Scaling Laws”给出 8 参数闭式 L(N,D,T),把外推 RMSE 平均降低 49% 并由数据-算力价格比驱动成本最优分配;Cornell 的 prescriptive scaling、Meta 的 compute-optimal tokenization 与学术侧“Geometric Wall”信息几何分析进一步把边界推向几何可解释。其二是生成式推荐(GR)的全栈深耕,从“更大的 Semantic ID”转向“更可表达、更对齐价值、更省算力”:UCSD/Snap 的“Latte”用前置 latent token 把解码树松弛为森林,突破 rank-reversal 表达力极限(NDCG@10 +3.45%);Tencent 的“UniVA”把价值对齐贯穿分词-解码-PPO 三层,线上 GMV +1.50%;Baidu 的“LASAR”首次将 Coconut 风格隐式递归推理移植到 decoder-only GR,比显式 CoT 快约 20×;快手“UxSID”以 target SID 为路由键索引离线兴趣 memory,实现 O(1) 在线推理,4 亿用户广告 A/B 取得 +0.337% Revenue。建模之外,阿里“CapsID”用 capsule 软路由替代 RQ-VAE 硬量化、HLEM 的 HBM 调度与小红书 CCD 线程编排持续压低推理成本,工业可部署性已成为与精度同等的评价维度。最值得警醒的是 Airbnb/MSU 的“TGH”:一个免训练图启发式审计了覆盖 87% 近期 GR 论文的 Amazon 基准,NDCG@10 反超 SOTA 生成式推荐器 17–44%,对整个领域评测体系敲响警钟。

每日概览

2026-05-05

  • 主题: Scaling Laws 三连发与领域 Foundation Model 实践
  • 论文数: 9 · 精读: 5

2026-05-06

  • 主题: AI 生成音乐流行度预测与 Agentic 工作流编排
  • 论文数: 2 · 精读: 0

2026-05-07

  • 主题: 生成式推荐与服务系统全栈优化:Semantic ID、对齐与 HBM 调度协同推进
  • 论文数: 6 · 精读: 5

2026-05-08

  • 主题: 生成式推荐表达力与价值对齐双线突破
  • 论文数: 6 · 精读: 2

2026-05-11

  • 主题: 生成式推荐基准审计与对话式语义ID落地
  • 论文数: 5 · 精读: 2

2026-05-12

  • 主题: 工业级推荐系统全栈突破与 LLM 缩放/几何理论双线深化
  • 论文数: 10 · 精读: 6