2026-04-06 日报
主题: Semantic ID 与生成式推荐工业实践
标签: generative-retrieval · semantic-id · industrial · ad-rec · multi-business
📊 统计: 共 14 篇 · 精读 4 · 🏢 工业界 4 · 🎓 学术 10 · other 3 · generative-rec 4 · llm 5 · discriminative-rec 2
综述
本期日报覆盖 2026-04-03 至 04-05 三天 ArXiv 提交,共 14 篇推荐相关论文(4 篇精读 + 10 篇摘要归档)。主线聚焦在生成式推荐与 Semantic ID 的工业落地:腾讯发布 Tencent Advertising Algorithm Challenge 2025(TencentGR-1M/10M)—— 首个公开的全模态工业级生成式推荐数据集,包含真实广告日志的协同 ID 与多模态表征,提供 6 种 embedding 与转化事件,解决以往公开数据集缺失工业转化的关键问题;Snapchat 公布了其 Semantic ID 在推荐系统中的工业部署经验;Meituan 的 MBGR 框架展示了多业务生成式推荐方案。此外 LLM 在推荐中的应用持续活跃,涵盖可解释推荐、列表式重排(位置偏置)、对话推荐与电路感知遗忘等方向。整体趋势:生成式范式正从学术探索走向真实工业部署,Semantic ID 作为离散接口被多家公司采用,工业级数据集和评测基准开始成熟。
重点论文
TencentGR · ⭐ 7/10
Tencent Advertising Algorithm Challenge 2025: All-Modality Generative Recommendation
🏢 Tencent · 生成式推荐
腾讯广告算法大赛 2025 发布 TencentGR-1M/10M 两个工业级全模态生成式推荐 benchmark:百万到千万级真实脱敏广告用户序列,同时包含曝光/点击/转化信号与多模态 embedding,提供 baseline Transformer 与加权 HitRate/NDCG 评估协议。
Semantic IDs · ⭐ 7/10
🏢 Snapchat · 生成式推荐
Snapchat 大规模部署 Semantic IDs 作为推荐系统的辅助特征和生成式检索目标,提出 STE 优化和多模态 embedding 融合解决 codebook collapse,并通过 intra-bucket 消歧和 depth-优先策略解决 SID-to-Item 解析问题
MBGR · ⭐ 7/10
MBGR: Multi-Business Prediction for Generative Recommendation at Meituan
🏢 Meituan · 生成式推荐
提出首个面向多业务场景的生成式推荐框架MBGR,通过BID、MBP和LDR三个模块解决跨业务跷跷板效应和表征混淆问题,在美团线上CTCVR提升3.98%
DebiasFirst · ⭐ 6/10
LLM-based Listwise Reranking under the Effect of Positional Bias
🏢 Baidu · 其他
提出DebiasFirst方法,通过逆倾向评分的位置校准和位置感知数据增强,在微调阶段缓解LLM列表式重排序中的位置偏差
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| TencentGR | Tencent Advertising Algorithm Challenge 2025: All-Modality Generative Recommendation | 生成式 | 🏢 Tencent | 8 | 7 |
| Semantic IDs | Semantic IDs for Recommender Systems at Snapchat: Use Cases, Technical Challenges, and Design Choices | 生成式 | 🏢 Snapchat | 7 | 7 |
| MBGR | MBGR: Multi-Business Prediction for Generative Recommendation at Meituan | 生成式 | 🏢 Meituan | 7 | 7 |
| DebiasFirst | LLM-based Listwise Reranking under the Effect of Positional Bias | 其他 | 🏢 Baidu | 7 | 6 |
| — | FoE: Forest of Errors Makes the First Solution the Best in Large Reasoning Models | LLM | 🎓 学术 | 6 | — |
| — | CURE:Circuit-Aware Unlearning for LLM-based Recommendation | LLM | 🎓 学术 | 5 | — |
| — | FLAME: Condensing Ensemble Diversity into a Single Network for Efficient Sequential Recommendation | 判别式 | 🎓 学术 | 5 | — |
| — | Fusion and Alignment Enhancement with Large Language Models for Tail-item Sequential Recommendation | LLM | 🎓 学术 | 5 | — |
| — | User Simulator-Guided Multi-Turn Preference Optimization for Reasoning LLM-based Conversational Recommendation | LLM | 🎓 学术 | 5 | — |
| — | User-Aware Conditional Generative Total Correlation Learning for Multi-Modal Recommendation | 生成式 | 🎓 学术 | 5 | — |
| — | Align then Train: Efficient Retrieval Adapter Learning | 其他 | 🎓 学术 | 4 | — |
| — | Rank, Don't Generate: Statement-level Ranking for Explainable Recommendation | 其他 | 🎓 学术 | 4 | — |
| — | Bilateral Intent-Enhanced Sequential Recommendation with Embedding Perturbation-Based Contrastive Learning | 判别式 | 🎓 学术 | 4 | — |
| — | MMP-Refer: Multimodal Path Retrieval-augmented LLMs For Explainable Recommendation | LLM | 🎓 学术 | 4 | — |