2026-05-08 日报

主题: 生成式推荐表达力与价值对齐双线突破

标签: semantic-id · transformer · rl · industrial · academic

📊 统计: 共 6 篇 · 精读 2 · 🏢 工业界 2 · 🎓 学术 4 · generative-rec 2 · llm 1 · discriminative-rec 2 · other 1

综述

本日共收录 6 篇论文，涵盖生成式推荐 2 篇、判别式推荐 2 篇、LLM 与检索各 1 篇，工业与学术贡献各占一半。重点工作集中在生成式推荐（GR）方向：UCSD 与 Snap 联合提出的 Latte（2605.06331）从理论上揭示了自回归 Semantic ID 解码受 tree-distance 概率耦合约束、无法表达 rank-reversal 与 forced-transitivity 的表达力极限，通过在目标 SID 前预置随机 latent token 将解码树松弛为森林，在 Amazon Reviews 上取得 NDCG@10 +3.45% 的提升；腾讯微信视频号广告团队的 UniVA（2605.05803）则把价值对齐贯穿 SID 分词、双头 Generation-as-Ranking 解码与 eCPM-aware PPO/MCTS-PPO 三层，离线 HR@100 提升 37.04%、线上 GMV +1.50%，是 GR 在广告场景落地的代表性工作。其余论文中，LatentRAG 把 Agentic RAG 的多步推理移入 latent 空间将延迟降低约 90%，Light-FMP 通过 hard-concrete mask 联合剪枝特征与模型，MINER 用层级探针把多层信号融合进单向量检索，UAT-MC 则针对多模态推荐 evasion 攻击提出跨模态梯度对齐的对抗训练。整体趋势看，GR 正从″更大的 SID″转向″更可表达、更对齐业务价值″的二阶段深耕，值得持续关注 latent 增强解码与 RL-based 价值对齐两条主线。

重点论文

Latte · ⭐ 8/10

Expressiveness Limits of Autoregressive Semantic ID Generation in Generative Recommendation

🏢 Snapchat · 生成式推荐

Latte 把目标 SID 前预置一个随机 latent token，把单棵 SID 解码树展开成森林，松弛由 tree-distance 强加的概率耦合，从而打破 GR 在 rank-reversal 与 forced-transitivity 两类基本场景上的表达力极限，在 Amazon Reviews 三类目带来 NDCG@10 +3.45% 的相对提升。

UniVA · ⭐ 8/10

Unified Value Alignment for Generative Recommendation in Industrial Advertising

🏢 Tencent · 生成式推荐

UniVA 在腾讯微信视频号广告平台上提出统一价值对齐的生成式推荐框架，通过 Commercial SID 分词器、Generation-as-Ranking 双头解码器和 eCPM-aware 强化学习实现 SID 构造、解码和服务三层的商业价值对齐，离线 HR@100 提升 37.04%，线上 GMV +1.50%。

全部论文

模型	标题	类别	公司	摘要分	精读分
Latte	Expressiveness Limits of Autoregressive Semantic ID Generation in Generative Recommendation	生成式	🏢 Snapchat	8	8
UniVA	Unified Value Alignment for Generative Recommendation in Industrial Advertising	生成式	🏢 Tencent	0	8
LatentRAG	LatentRAG: Latent Reasoning and Retrieval for Efficient Agentic RAG	LLM	🎓 学术	5	—
Light-FMP	Light-FMP: Lightweight Feature and Model Pruning for Enhanced Deep Recommender Systems	判别式	🎓 学术	5	—
MINER	MINER: Mining Multimodal Internal Representation for Efficient Retrieval	其他	🎓 学术	5	—
UAT-MC	Band Together: Untargeted Adversarial Training with Multimodal Coordination against Evasion-based Promotion Attacks	判别式	🎓 学术	4	—