2026-W18 周报
日期范围: 2026-04-27 ~ 2026-05-03
主题: Scaling Law 精细化与生成式推荐表征/推理双线突破
标签: parameter-scaling · semantic-id · pretrained-lm · transformer · industrial · sparse-attention
📊 统计: 共 38 篇 · 精读 15 · 覆盖 5 个工作日
周度综述
本周(2026-W18)共收录 38 篇论文,覆盖判别式推荐、生成式推荐、LLM 推荐与 Foundation Model 等方向,工业与学术大致 4:6,工业方涵盖快手、美团、苹果、字节、Meta、腾讯、IKEA 等。主线呈现两条清晰脉络:一是 Scaling Law 由""描述性""走向""规范性"",二是生成式 / LLM 推荐在表征离散化与推理加速两端同时发力。
Scaling Law 三连发是本周亮点:字节 InfoLaw(2605.01640)把训练重写为信息累积过程,用 quality density × log(K) 归一化指数衰减将 mixture×scale×repetition 坍缩为统一幂律,外推到 7B/425B token 误差仅 0.15%;Cornell Prescriptive Scaling Law(2605.02364)在 Chinchilla 上引入单参数过拟合惩罚,把 multi-epoch 拟合 R² 从 0.58 提升至 0.95,得出 compute 超阈值后应扩模型而非加 epoch 的反直觉结论;Meta Compute Optimal Tokenization(2605.01188)用 988 个 BLT 实验把""20 token/param""推广为 tokenizer 无关的""60 byte/param""。垂直域 Foundation Model 同步推进,Yale ReClaim(2605.02740)在 200M 入组人 43.8B 理赔事件上从零训 1.7B 模型,1208 病 AUC 75.57%,并将 embedding 引入因果推断,把 EASE 偏差降低 72%。
生成式 / LLM 推荐侧,快手 KSA(2604.24432)通过可学习 summary token 实现 O(n/k) 语义级 KV 压缩,与 GQA/MLA 正交可叠加 8×;快手 AdaSID(2604.23522)将 SID 碰撞处理升级为""语义豁免 + 自适应压力分配""两阶段框架,A/B GMV +0.98%;电子科大 CARD(2604.26427)用 SigLIP2 + 可逆 Kumaraswamy/scaled-logistic 矫正解决 codebook 利用不均;美团 FLR(2604.26760)把单向量 latent reasoning 解耦为 K 个偏好因子并配 GRPO;中科大 PAD-Rec(2604.27747)在 speculative decoding 草稿端注入 slot/draft 双位置嵌入,实现 3.1× wall-clock 加速。
趋势上,Semantic ID 正从静态量化迈向""语义/空间/负载自适应"",长序列 KV 压缩与 SID 自适应分配方法同源;Scaling Law 进入可直接指导 recipe 的""规范性""阶段;Foundation Model 范式向医疗等垂直域快速渗透。
每日概览
2026-04-28
- 主题: Semantic ID 工业落地与长序列 KV 压缩双线推进
- 论文数: 16 · 精读: 6
2026-04-30
- 主题: 生成式与 LLM 推荐:语义 ID、压缩重排与因子化潜推理
- 论文数: 8 · 精读: 3
2026-05-01
- 主题: LLM 生成式推荐的推理加速与列表重排
- 论文数: 2 · 精读: 1
2026-05-04
- 主题: 推荐系统负样本挖掘与多模态鲁棒性
- 论文数: 3 · 精读: 0
2026-05-05
- 主题: Scaling Laws 三连发与领域 Foundation Model 实践
- 论文数: 9 · 精读: 5