2026-04-30 日报

主题: 生成式与 LLM 推荐：语义 ID、压缩重排与因子化潜推理

标签: semantic-id · quantization · pretrained-lm · rl · academic

📊 统计: 共 8 篇 · 精读 3 · 🏢 工业界 2 · 🎓 学术 6 · generative-rec 2 · llm 1 · other 1 · discriminative-rec 4

综述

今日共 8 篇论文，3 篇精读、5 篇略读；类别分布为判别式推荐 4 篇、生成式推荐 2 篇、LLM 检索/重排 1 篇、隐私 1 篇，整体以学术为主。重点精读三篇均围绕"生成式 / LLM 范式下的表征与推理瓶颈"展开：CARD（电子科大）把文本、视觉与协同信号渲染为统一卡牌图像，由 SigLIP2 编码后引入可学习可逆的非均匀变换（Kumaraswamy CDF / scaled logistic）将 latent 矫正到近似均匀空间，同时缓解异质融合监督不足与 codebook 利用不均；RRK（Naver Labs）将 PISCO 风格多 token soft compression 引入 listwise 重排，每文档压成 8 个 memory token 后由 LoRA 微调的 8B Qwen2.5 单次前向 + 余弦打分蒸馏 jina-v3，在 BEIR 上较 0.6–4B 重排器加速 3×–18×、长文档场景达 10×–58×；FLR（美团 LongCat）把 LLM 推荐里的单向量 latent reasoning 解耦为 K 个偏好因子，配合多因子注意力、正交/多样/稀疏正则与噪声扰动版 GRPO，稳定优于 LatentR³。略读论文则从维度坍缩、时间算子、targeted DP 与 bandit 状态表征等角度补充判别式侧的分析视角。今日值得关注的趋势是"生成式推荐的离散化与 LLM 推荐的潜空间结构化"正同时发力——前者在量化与 codebook 均衡上做手术，后者在因子分解与 RL 探索上重塑推理路径。

重点论文

CARD · ⭐ 7/10

CARD: Non-Uniform Quantization of Visual Semantic Unit for Generative Recommendation

🎓 学术 · 生成式推荐

CARD 通过把文本/视觉/协同信号渲染为统一卡牌图像并由 SigLIP2 编码、再用可学习可逆的非均匀变换（Kumaraswamy CDF 或 scaled logistic）在残差量化前将 latent 矫正到近似均匀空间，同时解决生成式推荐中 SID 异质融合监督不足与 codebook 利用不均两大瓶颈。

RRK · ⭐ 7/10

Efficient Listwise Reranking with Compressed Document Representations

🏢 Naver · LLM

RRK 把 PISCO 风格的多 token soft compression 引入 listwise reranking，每文档压缩为 8 个 memory token 后由 LoRA 微调的 8B Qwen2.5 reranker 单次前向 + 余弦打分，蒸馏 jina-v3 教师；BEIR 上比 0.6–4B reranker 快 3×–18×，长文档场景效率优势放大到 10×–58×。

FLR · ⭐ 7/10

Factorized Latent Reasoning for LLM-based Recommendation

🏢 Meituan · 生成式推荐

FLR 把 LLM 推荐里的 latent reasoning 从单一向量分解为 K 个互相解耦的偏好因子，配合多因子注意力+正交/多样/稀疏正则与重新设计的 GRPO（噪声扰动探索+token confidence/exact match 混合奖励+L2 归一 advantage），在 Amazon 四子集上稳定优于 LatentR³。

全部论文

模型	标题	类别	公司	摘要分	精读分
CARD	CARD: Non-Uniform Quantization of Visual Semantic Unit for Generative Recommendation	生成式	🎓 学术	7	7
RRK	Efficient Listwise Reranking with Compressed Document Representations	LLM	🏢 Naver	7	7
FLR	Factorized Latent Reasoning for LLM-based Recommendation	生成式	🏢 Meituan	7	7
ProMax	ProMax: Exploring the Potential of LLM-derived Profiles with Distribution Shaping for Recommender Systems	判别式	🎓 学术	6	—
—	Understanding DNNs in Feature Interaction Models: A Dimensional Collapse Perspective	判别式	🎓 学术	6	—
TimeMM	TimeMM: Time-as-Operator Spectral Filtering for Dynamic Multimodal Recommendation	判别式	🎓 学术	5	—
—	Meta-Learning and Targeted Differential Privacy to Improve the Accuracy-Privacy Trade-off in Recommendations	其他	🎓 学术	4	—
—	The Bandit's Blind Spot: The Critical Role of User State Representation in Recommender Systems	判别式	🎓 学术	4	—