← 返回报告列表

2026-05-04 日报

日报 📅 2026-05-01
推荐系统负样本挖掘与多模态鲁棒性
contrastive-ssl pretrained-lm search-ranking industrial academic
📊 共 3 篇 · 精读 0

2026-05-04 日报

主题: 推荐系统负样本挖掘与多模态鲁棒性

标签: contrastive-ssl · pretrained-lm · search-ranking · industrial · academic

📊 统计: 共 3 篇 · 精读 0 · 🏢 工业界 0 · 🎓 学术 3 · discriminative-rec 2 · generative-rec 1

综述

本日共 3 篇推荐系统论文,2 篇判别式 + 1 篇生成式,工业与学术各占其一。DynamicPO 针对 LLM 推荐 DPO 训练中"偏好优化坍塌"现象,理论归因于 easy negatives 主导梯度,提出动态选择决策边界附近信息性负样本并按边界模糊度自适应 beta 系数,在三个公开数据集上稳定提升。IKEA.com 的稠密检索工业实践利用商品分类层级和属性构造结构化 hard negatives,并以 LLM-as-judge 生成相关性数据,离线类目准确率 +2.6%,但因 67% 热门搜索零点击率过半,长尾 query 的线上 A/B 无显著收益,揭示了离线指标与真实用户行为的鸿沟。GRE-MC 面向多模态推荐的模态缺失问题,通过模态感知子图检索 + 图 Transformer 联合编码,并用稀疏路由码本正则化潜表征以补全缺失模态。技术趋势上,负样本质量(hard/informative negative mining)和对比学习目标的精细化设计,正成为对比/偏好优化范式下提升推荐效果的共同抓手;同时工业落地强调离线-线上指标对齐与用户行为分布的诊断。

重点论文

DynamicPO · ⭐ 6/10

DynamicPO: Dynamic Preference Optimization for Recommendation

🎓 学术 · 生成式推荐

针对LLM推荐中DPO使用大量负样本反而性能下降的""偏好优化坍塌""问题,理论上归因于easy negatives主导梯度,提出DynamicPO:动态选择决策边界附近的信息性负样本并按边界模糊度调整beta系数。

Negative Data Mining for Contrastive Learning in Dense Retrieval at IKEA.com · ⭐ 6/10

🎓 学术 · 判别式推荐

IKEA电商搜索的稠密检索实践:用商品分类层级和属性构造结构化hard negatives,并以LLM-as-judge生成相关性训练数据;离线类目准确率+2.6%,但长尾query的线上A/B无显著差异,原因是67%热门搜索零点击率超50%。

GRE-MC · ⭐ 5/10

Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion

🎓 学术 · 判别式推荐

提出GRE-MC框架,用模态感知子图检索从全图选取语义相关子图,再以图Transformer联合编码补全缺失模态,并用可学习稀疏路由码本正则化潜表征以提升鲁棒性。

全部论文

模型 标题 类别 公司 摘要分 精读分
DynamicPO DynamicPO: Dynamic Preference Optimization for Recommendation 生成式 🎓 学术 6
Negative Data Mining for Contrastive Learning in Dense Retrieval at IKEA.com 判别式 🎓 学术 6
GRE-MC Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion 判别式 🎓 学术 5