2026-04-06 日报

主题: Semantic ID 与生成式推荐工业实践

标签: generative-retrieval · semantic-id · industrial · ad-rec · multi-business

📊 统计: 共 14 篇 · 精读 4 · 🏢 工业界 4 · 🎓 学术 10 · other 3 · generative-rec 4 · llm 5 · discriminative-rec 2

综述

本期日报覆盖 2026-04-03 至 04-05 三天 ArXiv 提交，共 14 篇推荐相关论文（4 篇精读 + 10 篇摘要归档）。主线聚焦在生成式推荐与 Semantic ID 的工业落地：腾讯发布 Tencent Advertising Algorithm Challenge 2025（TencentGR-1M/10M）—— 首个公开的全模态工业级生成式推荐数据集，包含真实广告日志的协同 ID 与多模态表征，提供 6 种 embedding 与转化事件，解决以往公开数据集缺失工业转化的关键问题；Snapchat 公布了其 Semantic ID 在推荐系统中的工业部署经验；Meituan 的 MBGR 框架展示了多业务生成式推荐方案。此外 LLM 在推荐中的应用持续活跃，涵盖可解释推荐、列表式重排（位置偏置）、对话推荐与电路感知遗忘等方向。整体趋势：生成式范式正从学术探索走向真实工业部署，Semantic ID 作为离散接口被多家公司采用，工业级数据集和评测基准开始成熟。

重点论文

TencentGR · ⭐ 7/10

Tencent Advertising Algorithm Challenge 2025: All-Modality Generative Recommendation

🏢 Tencent · 生成式推荐

腾讯广告算法大赛 2025 发布 TencentGR-1M/10M 两个工业级全模态生成式推荐 benchmark：百万到千万级真实脱敏广告用户序列，同时包含曝光/点击/转化信号与多模态 embedding，提供 baseline Transformer 与加权 HitRate/NDCG 评估协议。

Semantic IDs · ⭐ 7/10

Semantic IDs for Recommender Systems at Snapchat: Use Cases, Technical Challenges, and Design Choices

🏢 Snapchat · 生成式推荐

Snapchat 大规模部署 Semantic IDs 作为推荐系统的辅助特征和生成式检索目标，提出 STE 优化和多模态 embedding 融合解决 codebook collapse，并通过 intra-bucket 消歧和 depth-优先策略解决 SID-to-Item 解析问题

MBGR · ⭐ 7/10

MBGR: Multi-Business Prediction for Generative Recommendation at Meituan

🏢 Meituan · 生成式推荐

提出首个面向多业务场景的生成式推荐框架MBGR，通过BID、MBP和LDR三个模块解决跨业务跷跷板效应和表征混淆问题，在美团线上CTCVR提升3.98%

DebiasFirst · ⭐ 6/10

LLM-based Listwise Reranking under the Effect of Positional Bias

🏢 Baidu · 其他

提出DebiasFirst方法，通过逆倾向评分的位置校准和位置感知数据增强，在微调阶段缓解LLM列表式重排序中的位置偏差

全部论文

模型	标题	类别	公司	摘要分	精读分
TencentGR	Tencent Advertising Algorithm Challenge 2025: All-Modality Generative Recommendation	生成式	🏢 Tencent	8	7
Semantic IDs	Semantic IDs for Recommender Systems at Snapchat: Use Cases, Technical Challenges, and Design Choices	生成式	🏢 Snapchat	7	7
MBGR	MBGR: Multi-Business Prediction for Generative Recommendation at Meituan	生成式	🏢 Meituan	7	7
DebiasFirst	LLM-based Listwise Reranking under the Effect of Positional Bias	其他	🏢 Baidu	7	6
—	FoE: Forest of Errors Makes the First Solution the Best in Large Reasoning Models	LLM	🎓 学术	6	—
—	CURE:Circuit-Aware Unlearning for LLM-based Recommendation	LLM	🎓 学术	5	—
—	FLAME: Condensing Ensemble Diversity into a Single Network for Efficient Sequential Recommendation	判别式	🎓 学术	5	—
—	Fusion and Alignment Enhancement with Large Language Models for Tail-item Sequential Recommendation	LLM	🎓 学术	5	—
—	User Simulator-Guided Multi-Turn Preference Optimization for Reasoning LLM-based Conversational Recommendation	LLM	🎓 学术	5	—
—	User-Aware Conditional Generative Total Correlation Learning for Multi-Modal Recommendation	生成式	🎓 学术	5	—
—	Align then Train: Efficient Retrieval Adapter Learning	其他	🎓 学术	4	—
—	Rank, Don't Generate: Statement-level Ranking for Explainable Recommendation	其他	🎓 学术	4	—
—	Bilateral Intent-Enhanced Sequential Recommendation with Embedding Perturbation-Based Contrastive Learning	判别式	🎓 学术	4	—
—	MMP-Refer: Multimodal Path Retrieval-augmented LLMs For Explainable Recommendation	LLM	🎓 学术	4	—