2026-W24 周报
日期范围: 2026-06-08 ~ 2026-06-14
主题: 生成式推荐偏好对齐与 Transformer 原生架构双线工业落地
标签: industrial · semantic-id · pretrained-lm · transformer · rl
📊 统计: 共 47 篇 · 精读 16 · 覆盖 6 个工作日
周度综述
本周(2026-W24)共收录 47 篇论文、精读 16 篇,生成式推荐(约 15 篇)与判别式推荐(约 14 篇)平分主导,LLM 相关 11 篇、其他 8 篇;工业界参与度极高,JD、Netflix、Yandex、Meta、快手、Google、Snap、Shopee、腾讯、网易云音乐悉数登场,学术工作多集中于诊断与理论侧。三条主线贯穿全周。其一,偏好对齐(GRPO/DPO/KTO)正成为生成式推荐的训练范式:JD 的 AdaGRPO 把 RL 施奖从“均匀”改为“选择性准入”,仅在策略不确定且奖励可信处放行梯度;Netflix 的 Mult-DPO 把 DPO 从成对推广到 set-wise 多正样本并导出闭式可处理上界。其二,Semantic ID 已成生成式推荐的核心载体,并向可编辑、可判别、时序感知深化:快手 OneRetrieval 让运营免重训即可注入新词,Meta ChronoID 沿编码/融合/量化三维系统注入显式时间,Snap PauseRec 用可训练
每日概览
2026-06-09
- 主题: 工业级生成式推荐的强化偏好对齐与判别式 CTR 扩展双线
- 论文数: 15 · 精读: 6
2026-06-10
- 主题: LLM 语义驱动推荐与 2-bit 极致量化双线推进
- 论文数: 5 · 精读: 1
2026-06-11
- 主题: LLM 推荐检索工业落地:蒸馏与压缩的降本提效
- 论文数: 5 · 精读: 1
2026-06-12
- 主题: LLM 与生成式推荐:工业可编辑检索与内容污染鲁棒性
- 论文数: 5 · 精读: 1
2026-06-15
- 主题: Semantic ID 生成式推荐:隐式推理与显式时序注入
- 论文数: 5 · 精读: 2
2026-06-16
- 主题: 工业级 Transformer 原生推荐架构与生成式范式双线推进
- 论文数: 12 · 精读: 5