← 返回报告列表

2026-W22 周报

周报 📅 2026-05-25 ~ 2026-05-31
工业推荐全面落地:Semantic ID 量化、参数缩放与生成式建模三线并进
industrial semantic-id quantization parameter-scaling knowledge-distillation search-ranking
📊 共 54 篇 · 精读 19

2026-W22 周报

日期范围: 2026-05-25 ~ 2026-05-31

主题: 工业推荐全面落地:Semantic ID 量化、参数缩放与生成式建模三线并进

标签: industrial · semantic-id · quantization · parameter-scaling · knowledge-distillation · search-ranking

📊 统计: 共 54 篇 · 精读 19 · 覆盖 6 个工作日

周度综述

本周(2026-05-25 至 06-02)六份日报共收录 54 篇、精读 19 篇,判别式推荐为主,LLM 与生成式推荐并行;工业界论文占据全部精读名额,呈现压倒性的“产业落地”基调。技术主线可归纳为三条。其一,Semantic ID 与量化成为最热方向:腾讯 SIREN 将多模态信号由晚融合改为 item 级早融合,Pinterest PrefixMem 把 SID 视作需专用编码器的“模态”并令稀有物品准确率相对提升 115%,LinkedIn RQ-FSQ 首证跨域 viewer Semantic ID、最冷启用户段 +1.522% AUC,Shopee DRQ 给出诊断 tokenizer 失效的量化框架。其二,参数缩放从“能否 scale”转向“算力约束下如何落地”:Meta MobileMoE 确立端侧 MoE 扩展律,ByteDance Rec-Distill 以“教师 scaling 收益×可迁移性”解耦把 24B 教师收益蒸馏给轻量学生,Coupang 把搜索 CVR 缩放拆为 backbone/embedding/data 三维且收益可加。其三,生成式与测试时扩展加速迁入工业:阿里 UTTSI 作为首个免训练、模型无关的测试时计算扩展框架线上 +5.3% CTR,DeGRe 生成式重排淘宝闪购 GMV +3.75%,快手 FlowTime 以条件 Normalizing Flow 把高斯先验 warp 成个性化多峰分布、视频播放时长 +1.044%。架构层面,Pinterest UniPinRec 作为首个全栈统一检索与排序的生产系统,实现互动 +1%、端到端延迟 -11.1%、QPS +63.6%,是本周最具系统价值的工作。整体看,Semantic ID 量化、缩放-蒸馏落地与生成式分布建模构成本周三大主线,工业界已将这些前沿范式系统性地推向生产级。

每日概览

2026-05-26

  • 主题: 工业推荐系统:测试时扩展、生成式重排与效率优化
  • 论文数: 15 · 精读: 6

2026-05-27

  • 主题: 端侧 MoE 推理提效与工业级推荐流量治理
  • 论文数: 5 · 精读: 2

2026-05-28

  • 主题: LLM 与世界模型驱动推荐:工业落地与偏好对齐
  • 论文数: 6 · 精读: 2

2026-05-29

  • 主题: 工业推荐与搜索排序的参数缩放及高效落地
  • 论文数: 4 · 精读: 2

2026-06-01

  • 主题: 工业级推荐:统一检索排序架构与 Semantic ID 编码
  • 论文数: 9 · 精读: 3

2026-06-02

  • 主题: 工业级推荐落地:Semantic ID 量化与生成式建模双线突破
  • 论文数: 15 · 精读: 4