2026-06-08 日报
主题: Semantic ID 驱动的生成式与判别式推荐工业落地
标签: semantic-id · industrial · quantization · transformer · cold-start
📊 统计: 共 7 篇 · 精读 2 · 🏢 工业界 1 · 🎓 学术 6 · generative-rec 4 · discriminative-rec 1 · other 2
综述
今日共收录 7 篇推荐相关论文(生成式检索 4、判别式 1、其他 2),其中 2 篇精读、5 篇略读,工业界由阿里淘宝、Yandex 领衔。SSRLive(阿里)提出生成式-判别式混合的直播粗排,为每个直播间生成刻画主播稳定属性的静态 Semantic ID,与追踪实时人气的动态 SID(实时特征经 RQ-KMeans+EMA 在线码本量化),全量服务数亿用户,线上观看时长 +3.38%、GMV +0.72%。GBLA(Yandex)提出门控双向线性注意力,训练推理均为线性时间,在 Yandex Music 上匹配双向自注意力的检索质量,长序列下取得最高 8.2× 单层加速。CaLIR 以连续潜在意图状态替代显式 CoT,做类目引导的低延迟电商生成式检索;DREAM 针对 SID 冷启动,用反事实对比 tokenizer 与动态 beam 避免 token 过早坍缩。趋势上,Semantic ID 已成当日主线(7 篇中 5 篇涉及),围绕它的码本量化、冷启动、概念遗忘(TRACER)等可用性问题正成为新焦点,线性注意力则为长序列生成式检索提供效率路径。
重点论文
SSRLive · ⭐ 8/10
SSRLive: Live Streaming Recommendation with Dynamic Semantic ID
🏢 Alibaba · 判别式推荐
淘宝提出 SSRLive,生成式-判别式混合的直播粗排:给每个直播间同时生成刻画主播稳定属性的静态 SID(历史多模态+Swing 协同对比)和追踪实时人气的动态 SID(实时特征经 RQ-KMeans+EMA 在线码本量化),用 task query 与用户-直播 cross-attention 把 SID 和用户-主播交互特征喂进多任务预测,全量服务数亿用户,线上观看时长 +3.38%、GMV +0.72%。
GBLA · ⭐ 7/10
Gated Bidirectional Linear Attention for Generative Retrieval
🎓 学术 · 生成式推荐
提出 Gated Bidirectional Linear Attention (GBLA)——训练与推理均为线性时间的双向注意力层(核化线性注意力 + Conv1D + key gating + gated RMSNorm);以 [SA,LA,LA] 混合编码器在 Yandex Music 上匹配双向自注意力的检索质量,并在 H100、长度 32768 下相对 FlashAttention-v3 取得最高 8.2× 单层加速。
CaLIR · ⭐ 7/10
Beyond Matching: Category-Guided Latent Intent Reasoning for Generative Retrieval in E-Commerce
🎓 学术 · 生成式推荐
面向电商生成式检索提出类目引导的潜在意图推理框架 CaLIR:用连续潜在意图状态替代显式 CoT 以兼顾效果与低延迟,借助商品类目层级做粗到细意图对齐,并对多正样本查询做查询级推理增强,结合查询级动态前缀 trie 与推理感知约束解码。
DREAM · ⭐ 7/10
DREAM: Dynamic Refinement of Early Assignment Mappings
🎓 学术 · 生成式推荐
指出 SID 生成式推荐的冷启动瓶颈在于离线一次性静态 token 分配,提出三阶段框架 DREAM:意图感知 tokenizer 用反事实对比学习生成行为对齐候选池,冻结骨干作评估器无需重训择优,动态 beam 维持多个加权 SID 假设防过早坍缩,在三个 Amazon 基准冷启动指标上大幅领先。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| SSRLive | SSRLive: Live Streaming Recommendation with Dynamic Semantic ID | 判别式 | 🏢 Alibaba | 8 | 8 |
| GBLA | Gated Bidirectional Linear Attention for Generative Retrieval | 生成式 | 🎓 学术 | 8 | 7 |
| CaLIR | Beyond Matching: Category-Guided Latent Intent Reasoning for Generative Retrieval in E-Commerce | 生成式 | 🎓 学术 | 7 | — |
| DREAM | DREAM: Dynamic Refinement of Early Assignment Mappings | 生成式 | 🎓 学术 | 7 | — |
| TRACER | TRACER: Token ReAssignment for Concept ERasure in Generative Recommendation | 生成式 | 🎓 学术 | 6 | — |
| — | Bradley-Terry Rankings for Recommender Systems Across Dataset Taxonomies | 其他 | 🎓 学术 | 5 | — |
| ASH | ASH: Asymmetric Scalar Hashing With Learned Dimensionality Reduction for High-Fidelity Vector Quantization | 其他 | 🎓 学术 | 4 | — |