2026-06-01 日报
主题: 工业级推荐:统一检索排序架构与 Semantic ID 编码
标签: industrial · semantic-id · search-ranking · quantization
📊 统计: 共 9 篇 · 精读 3 · 🏢 工业界 3 · 🎓 学术 6 · discriminative-rec 5 · generative-rec 2 · llm 2 · other 1
综述
当日共收录 9 篇,精读 3 篇;类别上以判别式推荐(5)为主,生成式推荐(2)、LLM(2)与其他(1)并存,工业界 3 篇(Pinterest×2、Meta)、学术界 6 篇。重点首推 Pinterest 的 UniPinRec——首个全栈统一检索与排序的生产系统,以单输入格式、单共享骨干、单阶段联训,借 Masked Action Modeling 与跨进程 KV-cache 共享,实现线上互动 +1%、端到端延迟 -11.1%、QPS +63.6%;同属 Pinterest 的 PrefixMem 把 Semantic ID 视作像图像一样需专用编码器的模态,用前缀 n-gram 哈希记忆为 SID token 注入前缀条件表征,可跨 LLM 家族迁移,稀有物品准确率相对提升达 115%;Meta 的 SCALR 则把跨域事件迁移重铸为合成数据生成,以重叠用户共现统计估计 item 翻译分布,作为模型无关的数据层增强稳定提升在线转化。趋势上,工业界正把生成式建模、Semantic ID 与统一架构推向生产级落地,统一检索排序骨干、Semantic ID 专用编码与 KV-cache 复用是值得持续关注的方向。
重点论文
UniPinRec · ⭐ 9/10
UniPinRec: Unifying Generative Retrieval and Ranking at Pinterest Scale
🏢 Pinterest · 生成式推荐 / 判别式推荐
Pinterest 提出 UniPinRec——首个全栈统一检索与排序的生产系统(单输入格式/单共享骨干/单阶段联训), 靠 Masked Action Modeling 把动作监督加到非交错用户序列、靠跨进程 KV-cache 共享让排序复用检索的历史编码, 线上互动 +~1%、e2e 延迟 -11.1%、QPS +63.6%。
PrefixMem · ⭐ 8/10
LLMs Need Encoders for Semantic IDs Too
🏢 Pinterest · 生成式推荐
Pinterest 提出 PrefixMem——把 Semantic ID 当作像图像/音频一样需专用编码器的模态,用前缀 n-gram 哈希记忆表为每个 SID token 注入前缀条件表征,可独立预训练并跨 LLM 家族迁移,匹配算力下最深层 SID 准确率相对提升达 46%、硬样本上达 77%、稀有物品上达 115%。
SCALR · ⭐ 6/10
Synthetic Data from Cross-Domain Events for Large-Scale Recommendation Systems
🏢 Meta · 判别式推荐
Meta 提出 SCALR,把跨域事件迁移重铸为合成数据生成:用重叠用户共现统计估计 item 翻译分布、从中采样把源域事件翻译成目标域格式的合成训练样本,再用加权损失做数据层、模型无关的跨域增强,在线 A/B 一致提升转化率。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| UniPinRec | UniPinRec: Unifying Generative Retrieval and Ranking at Pinterest Scale | 生成式 / 判别式 | 9 | 9 | |
| PrefixMem | LLMs Need Encoders for Semantic IDs Too | 生成式 | 8 | 8 | |
| SCALR | Synthetic Data from Cross-Domain Events for Large-Scale Recommendation Systems | 判别式 | 🏢 Meta | 7 | 6 |
| — | Inner Product Aware Quantization: Provably Fast, Accurate, and Adaptive Algorithms | 其他 | 🎓 学术 | 5 | — |
| FOSTER | FOSTER: First-order Dataset Distillation for Text-based Sequential Recommendation | 判别式 | 🎓 学术 | 5 | — |
| SaFeAU | Beyond Instance-Level Alignment and Uniformity: Semantic Factor Learning for Collaborative Filtering | 判别式 | 🎓 学术 | 5 | — |
| cubic5 | How Much Orthogonalization Does Muon Need? | LLM | 🎓 学术 | 4 | — |
| CSTS | Contextual Scalarisation Thompson Sampling for multi-objective decisions in public media | 判别式 | 🎓 学术 | 4 | — |
| IRSL | Item Response Scaling Laws: A Measurement Theory Approach for Efficient and Generalizable Neural Scaling Estimation | LLM | 🎓 学术 | 4 | — |