← 返回报告列表

2026-06-08 日报

日报 📅 2026-06-05
Semantic ID 驱动的生成式与判别式推荐工业落地
semantic-id industrial quantization transformer cold-start
📊 共 7 篇 · 精读 2

2026-06-08 日报

主题: Semantic ID 驱动的生成式与判别式推荐工业落地

标签: semantic-id · industrial · quantization · transformer · cold-start

📊 统计: 共 7 篇 · 精读 2 · 🏢 工业界 1 · 🎓 学术 6 · generative-rec 4 · discriminative-rec 1 · other 2

综述

今日共收录 7 篇推荐相关论文(生成式检索 4、判别式 1、其他 2),其中 2 篇精读、5 篇略读,工业界由阿里淘宝、Yandex 领衔。SSRLive(阿里)提出生成式-判别式混合的直播粗排,为每个直播间生成刻画主播稳定属性的静态 Semantic ID,与追踪实时人气的动态 SID(实时特征经 RQ-KMeans+EMA 在线码本量化),全量服务数亿用户,线上观看时长 +3.38%、GMV +0.72%。GBLA(Yandex)提出门控双向线性注意力,训练推理均为线性时间,在 Yandex Music 上匹配双向自注意力的检索质量,长序列下取得最高 8.2× 单层加速。CaLIR 以连续潜在意图状态替代显式 CoT,做类目引导的低延迟电商生成式检索;DREAM 针对 SID 冷启动,用反事实对比 tokenizer 与动态 beam 避免 token 过早坍缩。趋势上,Semantic ID 已成当日主线(7 篇中 5 篇涉及),围绕它的码本量化、冷启动、概念遗忘(TRACER)等可用性问题正成为新焦点,线性注意力则为长序列生成式检索提供效率路径。

重点论文

SSRLive · ⭐ 8/10

SSRLive: Live Streaming Recommendation with Dynamic Semantic ID

🏢 Alibaba · 判别式推荐

淘宝提出 SSRLive,生成式-判别式混合的直播粗排:给每个直播间同时生成刻画主播稳定属性的静态 SID(历史多模态+Swing 协同对比)和追踪实时人气的动态 SID(实时特征经 RQ-KMeans+EMA 在线码本量化),用 task query 与用户-直播 cross-attention 把 SID 和用户-主播交互特征喂进多任务预测,全量服务数亿用户,线上观看时长 +3.38%、GMV +0.72%。

GBLA · ⭐ 7/10

Gated Bidirectional Linear Attention for Generative Retrieval

🎓 学术 · 生成式推荐

提出 Gated Bidirectional Linear Attention (GBLA)——训练与推理均为线性时间的双向注意力层(核化线性注意力 + Conv1D + key gating + gated RMSNorm);以 [SA,LA,LA] 混合编码器在 Yandex Music 上匹配双向自注意力的检索质量,并在 H100、长度 32768 下相对 FlashAttention-v3 取得最高 8.2× 单层加速。

CaLIR · ⭐ 7/10

Beyond Matching: Category-Guided Latent Intent Reasoning for Generative Retrieval in E-Commerce

🎓 学术 · 生成式推荐

面向电商生成式检索提出类目引导的潜在意图推理框架 CaLIR:用连续潜在意图状态替代显式 CoT 以兼顾效果与低延迟,借助商品类目层级做粗到细意图对齐,并对多正样本查询做查询级推理增强,结合查询级动态前缀 trie 与推理感知约束解码。

DREAM · ⭐ 7/10

DREAM: Dynamic Refinement of Early Assignment Mappings

🎓 学术 · 生成式推荐

指出 SID 生成式推荐的冷启动瓶颈在于离线一次性静态 token 分配,提出三阶段框架 DREAM:意图感知 tokenizer 用反事实对比学习生成行为对齐候选池,冻结骨干作评估器无需重训择优,动态 beam 维持多个加权 SID 假设防过早坍缩,在三个 Amazon 基准冷启动指标上大幅领先。

全部论文

模型 标题 类别 公司 摘要分 精读分
SSRLive SSRLive: Live Streaming Recommendation with Dynamic Semantic ID 判别式 🏢 Alibaba 8 8
GBLA Gated Bidirectional Linear Attention for Generative Retrieval 生成式 🎓 学术 8 7
CaLIR Beyond Matching: Category-Guided Latent Intent Reasoning for Generative Retrieval in E-Commerce 生成式 🎓 学术 7
DREAM DREAM: Dynamic Refinement of Early Assignment Mappings 生成式 🎓 学术 7
TRACER TRACER: Token ReAssignment for Concept ERasure in Generative Recommendation 生成式 🎓 学术 6
Bradley-Terry Rankings for Recommender Systems Across Dataset Taxonomies 其他 🎓 学术 5
ASH ASH: Asymmetric Scalar Hashing With Learned Dimensionality Reduction for High-Fidelity Vector Quantization 其他 🎓 学术 4