2026-06-01 日报

主题: 工业级推荐：统一检索排序架构与 Semantic ID 编码

标签: industrial · semantic-id · search-ranking · quantization

📊 统计: 共 9 篇 · 精读 3 · 🏢 工业界 3 · 🎓 学术 6 · discriminative-rec 5 · generative-rec 2 · llm 2 · other 1

综述

当日共收录 9 篇，精读 3 篇；类别上以判别式推荐（5）为主，生成式推荐（2）、LLM（2）与其他（1）并存，工业界 3 篇（Pinterest×2、Meta）、学术界 6 篇。重点首推 Pinterest 的 UniPinRec——首个全栈统一检索与排序的生产系统，以单输入格式、单共享骨干、单阶段联训，借 Masked Action Modeling 与跨进程 KV-cache 共享，实现线上互动 +1%、端到端延迟 -11.1%、QPS +63.6%；同属 Pinterest 的 PrefixMem 把 Semantic ID 视作像图像一样需专用编码器的模态，用前缀 n-gram 哈希记忆为 SID token 注入前缀条件表征，可跨 LLM 家族迁移，稀有物品准确率相对提升达 115%；Meta 的 SCALR 则把跨域事件迁移重铸为合成数据生成，以重叠用户共现统计估计 item 翻译分布，作为模型无关的数据层增强稳定提升在线转化。趋势上，工业界正把生成式建模、Semantic ID 与统一架构推向生产级落地，统一检索排序骨干、Semantic ID 专用编码与 KV-cache 复用是值得持续关注的方向。

重点论文

UniPinRec · ⭐ 9/10

UniPinRec: Unifying Generative Retrieval and Ranking at Pinterest Scale

🏢 Pinterest · 生成式推荐 / 判别式推荐

Pinterest 提出 UniPinRec——首个全栈统一检索与排序的生产系统(单输入格式/单共享骨干/单阶段联训), 靠 Masked Action Modeling 把动作监督加到非交错用户序列、靠跨进程 KV-cache 共享让排序复用检索的历史编码, 线上互动 +~1%、e2e 延迟 -11.1%、QPS +63.6%。

PrefixMem · ⭐ 8/10

LLMs Need Encoders for Semantic IDs Too

🏢 Pinterest · 生成式推荐

Pinterest 提出 PrefixMem——把 Semantic ID 当作像图像/音频一样需专用编码器的模态,用前缀 n-gram 哈希记忆表为每个 SID token 注入前缀条件表征,可独立预训练并跨 LLM 家族迁移,匹配算力下最深层 SID 准确率相对提升达 46%、硬样本上达 77%、稀有物品上达 115%。

SCALR · ⭐ 6/10

Synthetic Data from Cross-Domain Events for Large-Scale Recommendation Systems

🏢 Meta · 判别式推荐

Meta 提出 SCALR，把跨域事件迁移重铸为合成数据生成：用重叠用户共现统计估计 item 翻译分布、从中采样把源域事件翻译成目标域格式的合成训练样本，再用加权损失做数据层、模型无关的跨域增强，在线 A/B 一致提升转化率。

全部论文

模型	标题	类别	公司	摘要分	精读分
UniPinRec	UniPinRec: Unifying Generative Retrieval and Ranking at Pinterest Scale	生成式 / 判别式	🏢 Pinterest	9	9
PrefixMem	LLMs Need Encoders for Semantic IDs Too	生成式	🏢 Pinterest	8	8
SCALR	Synthetic Data from Cross-Domain Events for Large-Scale Recommendation Systems	判别式	🏢 Meta	7	6
—	Inner Product Aware Quantization: Provably Fast, Accurate, and Adaptive Algorithms	其他	🎓 学术	5	—
FOSTER	FOSTER: First-order Dataset Distillation for Text-based Sequential Recommendation	判别式	🎓 学术	5	—
SaFeAU	Beyond Instance-Level Alignment and Uniformity: Semantic Factor Learning for Collaborative Filtering	判别式	🎓 学术	5	—
cubic5	How Much Orthogonalization Does Muon Need?	LLM	🎓 学术	4	—
CSTS	Contextual Scalarisation Thompson Sampling for multi-objective decisions in public media	判别式	🎓 学术	4	—
IRSL	Item Response Scaling Laws: A Measurement Theory Approach for Efficient and Generalizable Neural Scaling Estimation	LLM	🎓 学术	4	—