← 返回报告列表

2026-06-01 日报

日报 📅 2026-05-29
工业级推荐:统一检索排序架构与 Semantic ID 编码
industrial semantic-id search-ranking quantization
📊 共 9 篇 · 精读 3

2026-06-01 日报

主题: 工业级推荐:统一检索排序架构与 Semantic ID 编码

标签: industrial · semantic-id · search-ranking · quantization

📊 统计: 共 9 篇 · 精读 3 · 🏢 工业界 3 · 🎓 学术 6 · discriminative-rec 5 · generative-rec 2 · llm 2 · other 1

综述

当日共收录 9 篇,精读 3 篇;类别上以判别式推荐(5)为主,生成式推荐(2)、LLM(2)与其他(1)并存,工业界 3 篇(Pinterest×2、Meta)、学术界 6 篇。重点首推 Pinterest 的 UniPinRec——首个全栈统一检索与排序的生产系统,以单输入格式、单共享骨干、单阶段联训,借 Masked Action Modeling 与跨进程 KV-cache 共享,实现线上互动 +1%、端到端延迟 -11.1%、QPS +63.6%;同属 Pinterest 的 PrefixMem 把 Semantic ID 视作像图像一样需专用编码器的模态,用前缀 n-gram 哈希记忆为 SID token 注入前缀条件表征,可跨 LLM 家族迁移,稀有物品准确率相对提升达 115%;Meta 的 SCALR 则把跨域事件迁移重铸为合成数据生成,以重叠用户共现统计估计 item 翻译分布,作为模型无关的数据层增强稳定提升在线转化。趋势上,工业界正把生成式建模、Semantic ID 与统一架构推向生产级落地,统一检索排序骨干、Semantic ID 专用编码与 KV-cache 复用是值得持续关注的方向。

重点论文

UniPinRec · ⭐ 9/10

UniPinRec: Unifying Generative Retrieval and Ranking at Pinterest Scale

🏢 Pinterest · 生成式推荐 / 判别式推荐

Pinterest 提出 UniPinRec——首个全栈统一检索与排序的生产系统(单输入格式/单共享骨干/单阶段联训), 靠 Masked Action Modeling 把动作监督加到非交错用户序列、靠跨进程 KV-cache 共享让排序复用检索的历史编码, 线上互动 +~1%、e2e 延迟 -11.1%、QPS +63.6%。

PrefixMem · ⭐ 8/10

LLMs Need Encoders for Semantic IDs Too

🏢 Pinterest · 生成式推荐

Pinterest 提出 PrefixMem——把 Semantic ID 当作像图像/音频一样需专用编码器的模态,用前缀 n-gram 哈希记忆表为每个 SID token 注入前缀条件表征,可独立预训练并跨 LLM 家族迁移,匹配算力下最深层 SID 准确率相对提升达 46%、硬样本上达 77%、稀有物品上达 115%。

SCALR · ⭐ 6/10

Synthetic Data from Cross-Domain Events for Large-Scale Recommendation Systems

🏢 Meta · 判别式推荐

Meta 提出 SCALR,把跨域事件迁移重铸为合成数据生成:用重叠用户共现统计估计 item 翻译分布、从中采样把源域事件翻译成目标域格式的合成训练样本,再用加权损失做数据层、模型无关的跨域增强,在线 A/B 一致提升转化率。

全部论文

模型 标题 类别 公司 摘要分 精读分
UniPinRec UniPinRec: Unifying Generative Retrieval and Ranking at Pinterest Scale 生成式 / 判别式 🏢 Pinterest 9 9
PrefixMem LLMs Need Encoders for Semantic IDs Too 生成式 🏢 Pinterest 8 8
SCALR Synthetic Data from Cross-Domain Events for Large-Scale Recommendation Systems 判别式 🏢 Meta 7 6
Inner Product Aware Quantization: Provably Fast, Accurate, and Adaptive Algorithms 其他 🎓 学术 5
FOSTER FOSTER: First-order Dataset Distillation for Text-based Sequential Recommendation 判别式 🎓 学术 5
SaFeAU Beyond Instance-Level Alignment and Uniformity: Semantic Factor Learning for Collaborative Filtering 判别式 🎓 学术 5
cubic5 How Much Orthogonalization Does Muon Need? LLM 🎓 学术 4
CSTS Contextual Scalarisation Thompson Sampling for multi-objective decisions in public media 判别式 🎓 学术 4
IRSL Item Response Scaling Laws: A Measurement Theory Approach for Efficient and Generalizable Neural Scaling Estimation LLM 🎓 学术 4