2026-04-30 日报
主题: 生成式与 LLM 推荐:语义 ID、压缩重排与因子化潜推理
标签: semantic-id · quantization · pretrained-lm · rl · academic
📊 统计: 共 8 篇 · 精读 3 · 🏢 工业界 2 · 🎓 学术 6 · generative-rec 2 · llm 1 · other 1 · discriminative-rec 4
综述
今日共 8 篇论文,3 篇精读、5 篇略读;类别分布为判别式推荐 4 篇、生成式推荐 2 篇、LLM 检索/重排 1 篇、隐私 1 篇,整体以学术为主。重点精读三篇均围绕"生成式 / LLM 范式下的表征与推理瓶颈"展开:CARD(电子科大)把文本、视觉与协同信号渲染为统一卡牌图像,由 SigLIP2 编码后引入可学习可逆的非均匀变换(Kumaraswamy CDF / scaled logistic)将 latent 矫正到近似均匀空间,同时缓解异质融合监督不足与 codebook 利用不均;RRK(Naver Labs)将 PISCO 风格多 token soft compression 引入 listwise 重排,每文档压成 8 个 memory token 后由 LoRA 微调的 8B Qwen2.5 单次前向 + 余弦打分蒸馏 jina-v3,在 BEIR 上较 0.6–4B 重排器加速 3×–18×、长文档场景达 10×–58×;FLR(美团 LongCat)把 LLM 推荐里的单向量 latent reasoning 解耦为 K 个偏好因子,配合多因子注意力、正交/多样/稀疏正则与噪声扰动版 GRPO,稳定优于 LatentR³。略读论文则从维度坍缩、时间算子、targeted DP 与 bandit 状态表征等角度补充判别式侧的分析视角。今日值得关注的趋势是"生成式推荐的离散化与 LLM 推荐的潜空间结构化"正同时发力——前者在量化与 codebook 均衡上做手术,后者在因子分解与 RL 探索上重塑推理路径。
重点论文
CARD · ⭐ 7/10
CARD: Non-Uniform Quantization of Visual Semantic Unit for Generative Recommendation
🎓 学术 · 生成式推荐
CARD 通过把文本/视觉/协同信号渲染为统一卡牌图像并由 SigLIP2 编码、再用可学习可逆的非均匀变换(Kumaraswamy CDF 或 scaled logistic)在残差量化前将 latent 矫正到近似均匀空间,同时解决生成式推荐中 SID 异质融合监督不足与 codebook 利用不均两大瓶颈。
RRK · ⭐ 7/10
Efficient Listwise Reranking with Compressed Document Representations
🏢 Naver · LLM
RRK 把 PISCO 风格的多 token soft compression 引入 listwise reranking,每文档压缩为 8 个 memory token 后由 LoRA 微调的 8B Qwen2.5 reranker 单次前向 + 余弦打分,蒸馏 jina-v3 教师;BEIR 上比 0.6–4B reranker 快 3×–18×,长文档场景效率优势放大到 10×–58×。
FLR · ⭐ 7/10
Factorized Latent Reasoning for LLM-based Recommendation
🏢 Meituan · 生成式推荐
FLR 把 LLM 推荐里的 latent reasoning 从单一向量分解为 K 个互相解耦的偏好因子,配合多因子注意力+正交/多样/稀疏正则与重新设计的 GRPO(噪声扰动探索+token confidence/exact match 混合奖励+L2 归一 advantage),在 Amazon 四子集上稳定优于 LatentR³。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| CARD | CARD: Non-Uniform Quantization of Visual Semantic Unit for Generative Recommendation | 生成式 | 🎓 学术 | 7 | 7 |
| RRK | Efficient Listwise Reranking with Compressed Document Representations | LLM | 🏢 Naver | 7 | 7 |
| FLR | Factorized Latent Reasoning for LLM-based Recommendation | 生成式 | 🏢 Meituan | 7 | 7 |
| ProMax | ProMax: Exploring the Potential of LLM-derived Profiles with Distribution Shaping for Recommender Systems | 判别式 | 🎓 学术 | 6 | — |
| — | Understanding DNNs in Feature Interaction Models: A Dimensional Collapse Perspective | 判别式 | 🎓 学术 | 6 | — |
| TimeMM | TimeMM: Time-as-Operator Spectral Filtering for Dynamic Multimodal Recommendation | 判别式 | 🎓 学术 | 5 | — |
| — | Meta-Learning and Targeted Differential Privacy to Improve the Accuracy-Privacy Trade-off in Recommendations | 其他 | 🎓 学术 | 4 | — |
| — | The Bandit's Blind Spot: The Critical Role of User State Representation in Recommender Systems | 判别式 | 🎓 学术 | 4 | — |