← 返回报告列表

2026-W24 周报

周报 📅 2026-06-08 ~ 2026-06-14
生成式推荐偏好对齐与 Transformer 原生架构双线工业落地
industrial semantic-id pretrained-lm transformer rl
📊 共 47 篇 · 精读 16

2026-W24 周报

日期范围: 2026-06-08 ~ 2026-06-14

主题: 生成式推荐偏好对齐与 Transformer 原生架构双线工业落地

标签: industrial · semantic-id · pretrained-lm · transformer · rl

📊 统计: 共 47 篇 · 精读 16 · 覆盖 6 个工作日

周度综述

本周(2026-W24)共收录 47 篇论文、精读 16 篇,生成式推荐(约 15 篇)与判别式推荐(约 14 篇)平分主导,LLM 相关 11 篇、其他 8 篇;工业界参与度极高,JD、Netflix、Yandex、Meta、快手、Google、Snap、Shopee、腾讯、网易云音乐悉数登场,学术工作多集中于诊断与理论侧。三条主线贯穿全周。其一,偏好对齐(GRPO/DPO/KTO)正成为生成式推荐的训练范式:JD 的 AdaGRPO 把 RL 施奖从“均匀”改为“选择性准入”,仅在策略不确定且奖励可信处放行梯度;Netflix 的 Mult-DPO 把 DPO 从成对推广到 set-wise 多正样本并导出闭式可处理上界。其二,Semantic ID 已成生成式推荐的核心载体,并向可编辑、可判别、时序感知深化:快手 OneRetrieval 让运营免重训即可注入新词,Meta ChronoID 沿编码/融合/量化三维系统注入显式时间,Snap PauseRec 用可训练 token 做隐式 latent 推理替代脆弱的显式 CoT、训练省 65% GPU。其三,Transformer 原生统一架构同时重塑两条路径:Shopee 的 OneRank 把多任务推理内化进 Transformer 栈(线上 GMV/UU +1.01%),快手 OneBar 用单个 BART encoder-decoder 取代多阶段检索级联(Guided GMV +21.67%)。工业落地亮点密集:快手 AIR 把基于 LLM 的跨域意图离线化为“原子行为-意图”缓存,以约 400 倍吞吐换实时语义、电商 +3.446% GMV;Google 把 Gemini Pro 蒸馏到 Nano 实时生成用户画像上线。配套地,LLM 蒸馏、2-bit 量化与 token 压缩正固化为推荐检索降本提效的标配组合。此外值得关注 Yandex 的 Gryphon(以 item 级打分让 SID 检索作为唯一召回源替换 15+ 召回器)与腾讯 TAPF(零额外推理成本的极性门控,在五种 CTR 架构上一致提升 AUC)。

每日概览

2026-06-09

  • 主题: 工业级生成式推荐的强化偏好对齐与判别式 CTR 扩展双线
  • 论文数: 15 · 精读: 6

2026-06-10

  • 主题: LLM 语义驱动推荐与 2-bit 极致量化双线推进
  • 论文数: 5 · 精读: 1

2026-06-11

  • 主题: LLM 推荐检索工业落地:蒸馏与压缩的降本提效
  • 论文数: 5 · 精读: 1

2026-06-12

  • 主题: LLM 与生成式推荐:工业可编辑检索与内容污染鲁棒性
  • 论文数: 5 · 精读: 1

2026-06-15

  • 主题: Semantic ID 生成式推荐:隐式推理与显式时序注入
  • 论文数: 5 · 精读: 2

2026-06-16

  • 主题: 工业级 Transformer 原生推荐架构与生成式范式双线推进
  • 论文数: 12 · 精读: 5