2026-W18 周报

日期范围: 2026-04-27 ~ 2026-05-03

主题: Scaling Law 精细化与生成式推荐表征/推理双线突破

标签: parameter-scaling · semantic-id · pretrained-lm · transformer · industrial · sparse-attention

📊 统计: 共 38 篇 · 精读 15 · 覆盖 5 个工作日

周度综述

本周（2026-W18）共收录 38 篇论文，覆盖判别式推荐、生成式推荐、LLM 推荐与 Foundation Model 等方向，工业与学术大致 4:6，工业方涵盖快手、美团、苹果、字节、Meta、腾讯、IKEA 等。主线呈现两条清晰脉络：一是 Scaling Law 由""描述性""走向""规范性""，二是生成式 / LLM 推荐在表征离散化与推理加速两端同时发力。

Scaling Law 三连发是本周亮点：字节 InfoLaw（2605.01640）把训练重写为信息累积过程，用 quality density × log(K) 归一化指数衰减将 mixture×scale×repetition 坍缩为统一幂律，外推到 7B/425B token 误差仅 0.15%；Cornell Prescriptive Scaling Law（2605.02364）在 Chinchilla 上引入单参数过拟合惩罚，把 multi-epoch 拟合 R² 从 0.58 提升至 0.95，得出 compute 超阈值后应扩模型而非加 epoch 的反直觉结论；Meta Compute Optimal Tokenization（2605.01188）用 988 个 BLT 实验把""20 token/param""推广为 tokenizer 无关的""60 byte/param""。垂直域 Foundation Model 同步推进，Yale ReClaim（2605.02740）在 200M 入组人 43.8B 理赔事件上从零训 1.7B 模型，1208 病 AUC 75.57%，并将 embedding 引入因果推断，把 EASE 偏差降低 72%。

生成式 / LLM 推荐侧，快手 KSA（2604.24432）通过可学习 summary token 实现 O(n/k) 语义级 KV 压缩，与 GQA/MLA 正交可叠加 8×；快手 AdaSID（2604.23522）将 SID 碰撞处理升级为""语义豁免 + 自适应压力分配""两阶段框架，A/B GMV +0.98%；电子科大 CARD（2604.26427）用 SigLIP2 + 可逆 Kumaraswamy/scaled-logistic 矫正解决 codebook 利用不均；美团 FLR（2604.26760）把单向量 latent reasoning 解耦为 K 个偏好因子并配 GRPO；中科大 PAD-Rec（2604.27747）在 speculative decoding 草稿端注入 slot/draft 双位置嵌入，实现 3.1× wall-clock 加速。

趋势上，Semantic ID 正从静态量化迈向""语义/空间/负载自适应""，长序列 KV 压缩与 SID 自适应分配方法同源；Scaling Law 进入可直接指导 recipe 的""规范性""阶段；Foundation Model 范式向医疗等垂直域快速渗透。

每日概览

2026-04-28

主题: Semantic ID 工业落地与长序列 KV 压缩双线推进
论文数: 16 · 精读: 6

2026-04-30

主题: 生成式与 LLM 推荐：语义 ID、压缩重排与因子化潜推理
论文数: 8 · 精读: 3

2026-05-01

主题: LLM 生成式推荐的推理加速与列表重排
论文数: 2 · 精读: 1

2026-05-04

主题: 推荐系统负样本挖掘与多模态鲁棒性
论文数: 3 · 精读: 0

2026-05-05

主题: Scaling Laws 三连发与领域 Foundation Model 实践
论文数: 9 · 精读: 5