2026-W19 周报

日期范围: 2026-05-04 ~ 2026-05-10

主题: 生成式推荐全栈深耕与 Scaling Law 理论双主线深化

标签: semantic-id · parameter-scaling · industrial · pretrained-lm · rl · academic

📊 统计: 共 38 篇 · 精读 20 · 覆盖 6 个工作日

周度综述

本周共收录 38 篇论文（约 20 篇精读），覆盖 LLM/Scaling、生成式推荐、判别式推荐与系统/检索四大块，工业界（ByteDance、Meta、Tencent、Alibaba、Kuaishou、Baidu、小红书、Airbnb）与学术界（Cornell、Yale、UCSD、MSU）贡献基本对半。两条主线贯穿全周。其一是 Scaling Law 从经验拟合迈向“可解释、可指导 recipe”的阶段：ByteDance 的“InfoLaw”把训练重写为信息累积过程，将 mixture×scale×repetition 坍缩到统一幂律，外推 7B 误差仅 0.15%；Arena Physica 的“Practical Scaling Laws”给出 8 参数闭式 L(N,D,T)，把外推 RMSE 平均降低 49% 并由数据-算力价格比驱动成本最优分配；Cornell 的 prescriptive scaling、Meta 的 compute-optimal tokenization 与学术侧“Geometric Wall”信息几何分析进一步把边界推向几何可解释。其二是生成式推荐（GR）的全栈深耕，从“更大的 Semantic ID”转向“更可表达、更对齐价值、更省算力”：UCSD/Snap 的“Latte”用前置 latent token 把解码树松弛为森林，突破 rank-reversal 表达力极限（NDCG@10 +3.45%）；Tencent 的“UniVA”把价值对齐贯穿分词-解码-PPO 三层，线上 GMV +1.50%；Baidu 的“LASAR”首次将 Coconut 风格隐式递归推理移植到 decoder-only GR，比显式 CoT 快约 20×；快手“UxSID”以 target SID 为路由键索引离线兴趣 memory，实现 O(1) 在线推理，4 亿用户广告 A/B 取得 +0.337% Revenue。建模之外，阿里“CapsID”用 capsule 软路由替代 RQ-VAE 硬量化、HLEM 的 HBM 调度与小红书 CCD 线程编排持续压低推理成本，工业可部署性已成为与精度同等的评价维度。最值得警醒的是 Airbnb/MSU 的“TGH”：一个免训练图启发式审计了覆盖 87% 近期 GR 论文的 Amazon 基准，NDCG@10 反超 SOTA 生成式推荐器 17–44%，对整个领域评测体系敲响警钟。

每日概览

2026-05-05

主题: Scaling Laws 三连发与领域 Foundation Model 实践
论文数: 9 · 精读: 5

2026-05-06

主题: AI 生成音乐流行度预测与 Agentic 工作流编排
论文数: 2 · 精读: 0

2026-05-07

主题: 生成式推荐与服务系统全栈优化：Semantic ID、对齐与 HBM 调度协同推进
论文数: 6 · 精读: 5

2026-05-08

主题: 生成式推荐表达力与价值对齐双线突破
论文数: 6 · 精读: 2

2026-05-11

主题: 生成式推荐基准审计与对话式语义ID落地
论文数: 5 · 精读: 2

2026-05-12

主题: 工业级推荐系统全栈突破与 LLM 缩放/几何理论双线深化
论文数: 10 · 精读: 6