← 返回报告列表

2026-06-16 日报

日报 📅 2026-06-13 ~ 2026-06-15
工业级 Transformer 原生推荐架构与生成式范式双线推进
transformer industrial search-ranking pretrained-lm
📊 共 12 篇 · 精读 5

2026-06-16 日报

主题: 工业级 Transformer 原生推荐架构与生成式范式双线推进

标签: transformer · industrial · search-ranking · pretrained-lm

📊 统计: 共 12 篇 · 精读 5 · 🏢 工业界 2 · 🎓 学术 10 · discriminative-rec 8 · llm 2 · generative-rec 3

综述

本日共收录 12 篇论文,以判别式推荐为主(8 篇),生成式推荐(3 篇)与 LLM(2 篇)为辅,工业界参与度高(Shopee、快手、腾讯、网易云音乐)。OneRank(Shopee)把多任务推理内化进 Transformer 栈,以任务 token 互不可见、候选感知上下文化与带梯度解耦的跨任务注意力消除编码器-预测器分离,线上 GMV/UU +1.01%;OneBar(快手)用单个 BART encoder-decoder 取代多阶段检索级联,并以免奖励模型的 on-policy 蒸馏(PIOPD)内化点击偏好,Guided GMV +21.67%;TAPF(腾讯)提出零额外推理成本的混合极性行为序列与目标条件极性门控,在五种 CTR 架构、三个数据集上一致提升 AUC;Arch-Warmup(Pluralis)以 warm-started 幂迭代在线追踪十亿参数 Transformer 的 Hessian 最大特征值,用零初始化逐步解锁深度把曲率约束在稳定边界内、抑制 loss spike。总体看,Transformer 原生架构正同时重塑判别式排序与生成式检索两条主线,工业落地与大模型训练稳定性并重。

重点论文

OneRank · ⭐ 8/10

OneRank: Unified Transformer-Native Ranking Architecture for Multi-Task Recommendation

🎓 学术 · 判别式推荐

提出 OneRank,把多任务推理内化进 Transformer 栈以消除编码器-预测器分离:任务 token 互不可见实现早期特化、候选感知上下文化弥合训练-服务 gap、带策略性梯度解耦的跨任务注意力做受控知识迁移、动态匹配打分替代静态 MLP head,在 Shopee 线上取得 GMV/UU +1.01%。

OneBar · ⭐ 8/10

OneBar: An End-to-End Content-Grounded Generative Query Recommendation Framework for E-Commerce Video Feeds

🏢 Kuaishou · 生成式推荐

提出 OneBar,面向短视频电商信息流底栏的端到端内容接地生成式查询推荐框架,用单个 BART encoder-decoder 取代多阶段检索级联,并通过 PIOPD(偏好内化 on-policy 蒸馏)免奖励模型地内化后验点击偏好,在快手主信息流在线 A/B 取得 Guided GMV +21.67%。

TAPF · ⭐ 8/10

Beyond Positive Signals: Unlocking Implicit Negative Behaviors for Enhanced Sequential User Modeling

🏢 Tencent · 判别式推荐

提出混合极性行为序列(固定长度预算内按时序交错正负反馈 token、替换部分正向 token,零额外在线推理成本)+ 轻量 Target-Aware Polarity Fusion 目标条件极性门控,在 DIN/Transformer/OneTrans/HyFormer/MixFormer 五种 CTR 架构、三个数据集上一致取得 +1.9%~+9.6% 相对 AUC 提升。

Arch-Warmup · ⭐ 7/10

Taming Curvature: Architecture Warm-Up for Stable Transformer Training

🎓 学术 · LLM

提出 warm-started 幂迭代(复用上一步顶特征向量 + HVP,每步<5次)实现十亿参数级 Transformer 的在线(预条件)Hessian 最大特征值追踪,并基于 Edge-of-Stability 理论提出'架构 warm-up'——用零初始化逐步解锁网络深度把有效曲率约束在稳定边界内,在不拖慢收敛的前提下减少 loss spike 并拓宽可用学习率范围。

全部论文

模型 标题 类别 公司 摘要分 精读分
OneRank OneRank: Unified Transformer-Native Ranking Architecture for Multi-Task Recommendation 判别式 🎓 学术 8 8
OneBar OneBar: An End-to-End Content-Grounded Generative Query Recommendation Framework for E-Commerce Video Feeds 生成式 🏢 Kuaishou 8 8
TAPF Beyond Positive Signals: Unlocking Implicit Negative Behaviors for Enhanced Sequential User Modeling 判别式 🏢 Tencent 7 8
Arch-Warmup Taming Curvature: Architecture Warm-Up for Stable Transformer Training LLM 🎓 学术 7 7
PIANO PIANO: Personalized Reranking via Information Aggregation Node for Music Search Optimization 判别式 🎓 学术 7 6
IIRG On the Memorization Behavior of LLMs in Generative Recommendation: Observations, Implications, and Training Strategies 生成式 / LLM 🎓 学术 7
HoloRec HoloRec: Holistic Encoding and Interleaved Reasoning for Generative Recommendation 生成式 🎓 学术 7
SRPFN One Sequential Recommendation Model Pretrained from Synthetic Priors Predicts Multiple Datasets 判别式 🎓 学术 7
ReaEmb Harmonizing Semantic and Collaborative in LLMs: Reasoning-based Embedding Generator for Sequential Recommendation 判别式 🎓 学术 6
How Much Do Reviews Really Contribute? A Study on Text-Enriched Matrix Factorization for Recommendations 判别式 🎓 学术 4
Leveraging Code-Mixed Product Metadata and User Feedback for Personalized Recommendation on Daraz Bangladesh 判别式 🎓 学术 4
Guiding Federated Graph Recommendation with LLM-encoded knowledge 判别式 🎓 学术 4