2026-05-04 日报

主题: 推荐系统负样本挖掘与多模态鲁棒性

标签: contrastive-ssl · pretrained-lm · search-ranking · industrial · academic

📊 统计: 共 3 篇 · 精读 0 · 🏢 工业界 0 · 🎓 学术 3 · discriminative-rec 2 · generative-rec 1

综述

本日共 3 篇推荐系统论文，2 篇判别式 + 1 篇生成式,工业与学术各占其一。DynamicPO 针对 LLM 推荐 DPO 训练中"偏好优化坍塌"现象,理论归因于 easy negatives 主导梯度,提出动态选择决策边界附近信息性负样本并按边界模糊度自适应 beta 系数,在三个公开数据集上稳定提升。IKEA.com 的稠密检索工业实践利用商品分类层级和属性构造结构化 hard negatives,并以 LLM-as-judge 生成相关性数据,离线类目准确率 +2.6%,但因 67% 热门搜索零点击率过半,长尾 query 的线上 A/B 无显著收益,揭示了离线指标与真实用户行为的鸿沟。GRE-MC 面向多模态推荐的模态缺失问题,通过模态感知子图检索 + 图 Transformer 联合编码,并用稀疏路由码本正则化潜表征以补全缺失模态。技术趋势上,负样本质量(hard/informative negative mining)和对比学习目标的精细化设计,正成为对比/偏好优化范式下提升推荐效果的共同抓手;同时工业落地强调离线-线上指标对齐与用户行为分布的诊断。

重点论文

DynamicPO · ⭐ 6/10

DynamicPO: Dynamic Preference Optimization for Recommendation

🎓 学术 · 生成式推荐

针对LLM推荐中DPO使用大量负样本反而性能下降的""偏好优化坍塌""问题，理论上归因于easy negatives主导梯度，提出DynamicPO：动态选择决策边界附近的信息性负样本并按边界模糊度调整beta系数。

Negative Data Mining for Contrastive Learning in Dense Retrieval at IKEA.com · ⭐ 6/10

🎓 学术 · 判别式推荐

IKEA电商搜索的稠密检索实践：用商品分类层级和属性构造结构化hard negatives，并以LLM-as-judge生成相关性训练数据；离线类目准确率+2.6%，但长尾query的线上A/B无显著差异，原因是67%热门搜索零点击率超50%。

GRE-MC · ⭐ 5/10

Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion

🎓 学术 · 判别式推荐

提出GRE-MC框架，用模态感知子图检索从全图选取语义相关子图，再以图Transformer联合编码补全缺失模态，并用可学习稀疏路由码本正则化潜表征以提升鲁棒性。

全部论文

模型	标题	类别	公司	摘要分	精读分
DynamicPO	DynamicPO: Dynamic Preference Optimization for Recommendation	生成式	🎓 学术	6	—
—	Negative Data Mining for Contrastive Learning in Dense Retrieval at IKEA.com	判别式	🎓 学术	6	—
GRE-MC	Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion	判别式	🎓 学术	5	—