2026-06-18 日报
主题: 冷启动推荐双线攻坚:隐式反馈去噪与多模态召回
标签: cold-start · industrial · contrastive-ssl · pretrained-lm
📊 统计: 共 3 篇 · 精读 2 · 🏢 工业界 2 · 🎓 学术 1 · generative-rec 1 · discriminative-rec 2
综述
当日共收录 3 篇推荐系统论文,其中 2 篇精读、1 篇略读;按类别分为生成式推荐 1 篇与判别式推荐 2 篇,工业界(快手、Zalando)占两篇、学术界一篇。DIF(快手)提出模型无关的冷启动隐式反馈去噪框架,用内容相似暖物品的协同表征生成置信度加权伪标签,再以相对熵与冷启动状态估计样本不确定性自适应修正噪声标签,十亿级线上部署显著提升冷启动商业指标。VCG(Zalando)是一套 zero-shot 双塔多模态召回引擎,用领域适配 CLIP 把用户交互聚合与视频帧均值映射到同一流形做点积召回,实证生成式 LLM embedding 因表征坍塌不适合检索、判别式 CLIP 才适用,线上深度完播提升 50%。SAERec(学术)用稀疏自编码器从 LLM 文本 embedding 潜空间解耦细粒度可解释意图作为先验注入序列建模,公开数据集超越 SOTA。趋势上,冷启动仍是工业推荐核心痛点,内容与多模态表征同协同信号的对齐成为破局主线;判别式对比表征在召回侧优于生成式 embedding,而 SAE 可解释性为 LLM 驱动推荐开辟了新的先验注入路径。
重点论文
DIF · ⭐ 8/10
Denoising Implicit Feedback for Cold-start Recommendation
🏢 Kuaishou · 生成式推荐
快手提出模型无关的冷启动隐式反馈去噪方法 DIF:用内容相似暖物品的协同表征为冷启动物品生成置信度加权伪标签,再以相对熵+冷启动状态估计样本不确定性自适应修正噪声标签,十亿级线上部署显著提升冷启动商业指标。
VCG · ⭐ 6/10
VCG: A Multimodal Retrieval Framework for E-Commerce Video Feeds under Extreme Cold-Start Conditions
🏢 Zalando · 判别式推荐
Zalando 提出 VCG——一套 zero-shot 双塔多模态召回引擎,用领域适配 CLIP 把用户(商品交互聚合)与视频(帧均值)映射到同一流形做点积召回,攻克电商短视频流的极端冷启动,并实证生成式 LLM embedding 因表征坍塌不适合检索、判别式 CLIP 才适合,线上 A/B 深度完播 +50%。
SAERec · ⭐ 6/10
SAERec: Constructing Fine-grained Interpretable Intents Priors via Sparse Autoencoders for Recommendation
🎓 学术 · 判别式推荐
SAERec 用稀疏自编码器(SAE)从大模型文本 embedding 的潜空间中解耦出细粒度、可解释的意图集合,为每个用户检索个人意图与公共意图作为先验,再通过多分支注意力与自适应融合注入序列建模;在公开数据集上超越 SOTA 且提供可读解释,但仅有学术验证。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| DIF | Denoising Implicit Feedback for Cold-start Recommendation | 生成式 | 🏢 Kuaishou | 7 | 8 |
| VCG | VCG: A Multimodal Retrieval Framework for E-Commerce Video Feeds under Extreme Cold-Start Conditions | 判别式 | 🏢 Zalando | 7 | 6 |
| SAERec | SAERec: Constructing Fine-grained Interpretable Intents Priors via Sparse Autoencoders for Recommendation | 判别式 | 🎓 学术 | 6 | — |