2026-05-04 日报
主题: 推荐系统负样本挖掘与多模态鲁棒性
标签: contrastive-ssl · pretrained-lm · search-ranking · industrial · academic
📊 统计: 共 3 篇 · 精读 0 · 🏢 工业界 0 · 🎓 学术 3 · discriminative-rec 2 · generative-rec 1
综述
本日共 3 篇推荐系统论文,2 篇判别式 + 1 篇生成式,工业与学术各占其一。DynamicPO 针对 LLM 推荐 DPO 训练中"偏好优化坍塌"现象,理论归因于 easy negatives 主导梯度,提出动态选择决策边界附近信息性负样本并按边界模糊度自适应 beta 系数,在三个公开数据集上稳定提升。IKEA.com 的稠密检索工业实践利用商品分类层级和属性构造结构化 hard negatives,并以 LLM-as-judge 生成相关性数据,离线类目准确率 +2.6%,但因 67% 热门搜索零点击率过半,长尾 query 的线上 A/B 无显著收益,揭示了离线指标与真实用户行为的鸿沟。GRE-MC 面向多模态推荐的模态缺失问题,通过模态感知子图检索 + 图 Transformer 联合编码,并用稀疏路由码本正则化潜表征以补全缺失模态。技术趋势上,负样本质量(hard/informative negative mining)和对比学习目标的精细化设计,正成为对比/偏好优化范式下提升推荐效果的共同抓手;同时工业落地强调离线-线上指标对齐与用户行为分布的诊断。
重点论文
DynamicPO · ⭐ 6/10
DynamicPO: Dynamic Preference Optimization for Recommendation
🎓 学术 · 生成式推荐
针对LLM推荐中DPO使用大量负样本反而性能下降的""偏好优化坍塌""问题,理论上归因于easy negatives主导梯度,提出DynamicPO:动态选择决策边界附近的信息性负样本并按边界模糊度调整beta系数。
Negative Data Mining for Contrastive Learning in Dense Retrieval at IKEA.com · ⭐ 6/10
🎓 学术 · 判别式推荐
IKEA电商搜索的稠密检索实践:用商品分类层级和属性构造结构化hard negatives,并以LLM-as-judge生成相关性训练数据;离线类目准确率+2.6%,但长尾query的线上A/B无显著差异,原因是67%热门搜索零点击率超50%。
GRE-MC · ⭐ 5/10
Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion
🎓 学术 · 判别式推荐
提出GRE-MC框架,用模态感知子图检索从全图选取语义相关子图,再以图Transformer联合编码补全缺失模态,并用可学习稀疏路由码本正则化潜表征以提升鲁棒性。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| DynamicPO | DynamicPO: Dynamic Preference Optimization for Recommendation | 生成式 | 🎓 学术 | 6 | — |
| — | Negative Data Mining for Contrastive Learning in Dense Retrieval at IKEA.com | 判别式 | 🎓 学术 | 6 | — |
| GRE-MC | Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion | 判别式 | 🎓 学术 | 5 | — |