2026-05-08 日报
主题: 生成式推荐表达力与价值对齐双线突破
标签: semantic-id · transformer · rl · industrial · academic
📊 统计: 共 6 篇 · 精读 2 · 🏢 工业界 2 · 🎓 学术 4 · generative-rec 2 · llm 1 · discriminative-rec 2 · other 1
综述
本日共收录 6 篇论文,涵盖生成式推荐 2 篇、判别式推荐 2 篇、LLM 与检索各 1 篇,工业与学术贡献各占一半。重点工作集中在生成式推荐(GR)方向:UCSD 与 Snap 联合提出的 Latte(2605.06331)从理论上揭示了自回归 Semantic ID 解码受 tree-distance 概率耦合约束、无法表达 rank-reversal 与 forced-transitivity 的表达力极限,通过在目标 SID 前预置随机 latent token 将解码树松弛为森林,在 Amazon Reviews 上取得 NDCG@10 +3.45% 的提升;腾讯微信视频号广告团队的 UniVA(2605.05803)则把价值对齐贯穿 SID 分词、双头 Generation-as-Ranking 解码与 eCPM-aware PPO/MCTS-PPO 三层,离线 HR@100 提升 37.04%、线上 GMV +1.50%,是 GR 在广告场景落地的代表性工作。其余论文中,LatentRAG 把 Agentic RAG 的多步推理移入 latent 空间将延迟降低约 90%,Light-FMP 通过 hard-concrete mask 联合剪枝特征与模型,MINER 用层级探针把多层信号融合进单向量检索,UAT-MC 则针对多模态推荐 evasion 攻击提出跨模态梯度对齐的对抗训练。整体趋势看,GR 正从″更大的 SID″转向″更可表达、更对齐业务价值″的二阶段深耕,值得持续关注 latent 增强解码与 RL-based 价值对齐两条主线。
重点论文
Latte · ⭐ 8/10
Expressiveness Limits of Autoregressive Semantic ID Generation in Generative Recommendation
🏢 Snapchat · 生成式推荐
Latte 把目标 SID 前预置一个随机 latent token,把单棵 SID 解码树展开成森林,松弛由 tree-distance 强加的概率耦合,从而打破 GR 在 rank-reversal 与 forced-transitivity 两类基本场景上的表达力极限,在 Amazon Reviews 三类目带来 NDCG@10 +3.45% 的相对提升。
UniVA · ⭐ 8/10
Unified Value Alignment for Generative Recommendation in Industrial Advertising
🏢 Tencent · 生成式推荐
UniVA 在腾讯微信视频号广告平台上提出统一价值对齐的生成式推荐框架,通过 Commercial SID 分词器、Generation-as-Ranking 双头解码器和 eCPM-aware 强化学习实现 SID 构造、解码和服务三层的商业价值对齐,离线 HR@100 提升 37.04%,线上 GMV +1.50%。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| Latte | Expressiveness Limits of Autoregressive Semantic ID Generation in Generative Recommendation | 生成式 | 🏢 Snapchat | 8 | 8 |
| UniVA | Unified Value Alignment for Generative Recommendation in Industrial Advertising | 生成式 | 🏢 Tencent | 0 | 8 |
| LatentRAG | LatentRAG: Latent Reasoning and Retrieval for Efficient Agentic RAG | LLM | 🎓 学术 | 5 | — |
| Light-FMP | Light-FMP: Lightweight Feature and Model Pruning for Enhanced Deep Recommender Systems | 判别式 | 🎓 学术 | 5 | — |
| MINER | MINER: Mining Multimodal Internal Representation for Efficient Retrieval | 其他 | 🎓 学术 | 5 | — |
| UAT-MC | Band Together: Untargeted Adversarial Training with Multimodal Coordination against Evasion-based Promotion Attacks | 判别式 | 🎓 学术 | 4 | — |