2026-06-12 日报

主题: LLM 与生成式推荐:工业可编辑检索与内容污染鲁棒性

标签: semantic-id · pretrained-lm · industrial · search-ranking

📊 统计: 共 5 篇 · 精读 1 · 🏢 工业界 1 · 🎓 学术 4 · generative-rec 1 · llm 3 · discriminative-rec 1

综述

当日共 5 篇,类别分布为生成式推荐 1 篇、LLM 相关 3 篇、判别式推荐 1 篇,仅 1 篇出自工业界(快手)其余均为学术,1 篇精读。重点为快手 OneRetrieval:首个"可编辑"生成式电商检索,用 Keyword-Aligned Encoding 把每个 SID 位置绑定到可解释属性词并预留空槽,运营无需重训即可注入新词,深召回与最强生成式基线 OneSearch 打平、干预命中率高出闭码本一个数量级,线上替换倒排与稠密双分支后转化不降、CTR 显著提升。FORGE benchmark 在受控网页污染下衡量搜索增强 LLM 推荐假货的程度:单页污染最高诱导率 27%、top-3 全替换达 73.8%,且推理与怀疑式提示反而常编造"社会证明"。CFALR 用 CF 增强 embedding 桥接语义与协同空间做个性化穿搭推荐;Gefen 优化器跨参数块共享二阶矩并量化一阶矩,较 AdamW 省约 8x 优化器显存。趋势上,生成式/LLM 推荐正走向可解释与可运营干预的工业落地,同时内容污染鲁棒性与训练显存效率成为新的关注点。

重点论文

OneRetrieval · ⭐ 8/10

OneRetrieval: Unifying Multi-Branch E-commerce Retrieval with an Editable Generative Model

🏢 Kuaishou · 生成式推荐

快手提出 OneRetrieval,首个可编辑的生成式电商检索:用 Keyword-Aligned Encoding 把每个 SID 位置绑定到可解释属性词并预留空槽,运营无需重训即可注入新词;深召回与最强生成式 baseline OneSearch 打平、干预命中率高出闭码本一个数量级,线上替换倒排/稠密双分支转化不降而 CTR 显著提升。

One Polluted Page Is Enough: Evaluating Web Content Pollution in Generative Recommenders · ⭐ 6/10

🎓 学术 · LLM

提出 FORGE benchmark,在受控网页内容污染下衡量搜索增强 LLM 推荐假货的程度:覆盖 15 类 225 个真实产品,12 个商用/开源模型上单页污染最高诱导率 27%、top-3 全替换达 73.8%。发现推理与怀疑式提示不仅无法缓解,反而常编造"社会证明",过滤类防御又有误伤合法产品风险。

CFALR · ⭐ 6/10

CFALR: Collaborative Filtering-Augmented Large Language Model for Personalized Fashion Outfit Recommendation

🎓 学术 · LLM

提出 CFALR,把用户-穿搭交互用自然语言描述并用 LLM 捕捉时尚语义,同时用 CF 增强 embedding 桥接语义空间与协同交互空间,以生成机制高效遍历穿搭组合空间。在 Polyvore/IQON 上的个性化填空与穿搭生成任务优于传统 CF 与 LLM 基线。

Gefen · ⭐ 6/10

Gefen: Optimized Stochastic Optimizer

🎓 学术 · LLM

提出 Gefen 优化器:自动在参数块间共享二阶矩估计,并用学习到的码本量化一阶矩,相对 AdamW 减少约 8x 优化器显存而保持同等性能。由 Hessian 对齐参数适合共享二阶统计的理论结果驱动,FSDP/DDP 下因显存下降可用更大 microbatch 提升吞吐,作为 drop-in 替换提供并附 CUDA kernel。

全部论文

模型	标题	类别	公司	摘要分	精读分
OneRetrieval	OneRetrieval: Unifying Multi-Branch E-commerce Retrieval with an Editable Generative Model	生成式	🏢 Kuaishou	8	8
—	One Polluted Page Is Enough: Evaluating Web Content Pollution in Generative Recommenders	LLM	🎓 学术	6	—
CFALR	CFALR: Collaborative Filtering-Augmented Large Language Model for Personalized Fashion Outfit Recommendation	LLM	🎓 学术	6	—
Gefen	Gefen: Optimized Stochastic Optimizer	LLM	🎓 学术	6	—
—	Mood-Aware Music Recommendation: Integrating User Affective Signals into Ranking Systems	判别式	🎓 学术	4	—