2026-04-21 日报
主题: 工业排序表征质量提升与生成式推荐理论基础双线并进
标签: ctr-prediction · feature-interaction · scaling · industrial · generative-retrieval
📊 统计: 共 12 篇 · 精读 3 · 🏢 工业界 3 · 🎓 学术 9 · discriminative-rec 6 · generative-rec 1 · llm 3 · other 2
综述
2026-04-21 共收录 12 篇论文,判别式推荐 6 篇、LLM 方向 3 篇、其他 2 篇、生成式推荐 1 篇;精读论文 3 篇均来自国内大厂,工业落地色彩浓厚。
重点论文方面,腾讯 RankUp(2604.17878)从「有效秩」视角系统解决 MetaFormer 排序器的表征坍缩问题,提出随机置换分片、多嵌入表、全局 token 等五项机制,在微信三大广告场景实现 3.41–4.81% GMV 提升,是本日工程落地最扎实的工作。美团 SIF(2604.15650)将序列建模的粒度从 item-level 升级到 sample-level,通过离线 HGAQ 将完整历史交互压缩为 Token Sample,再以分解注意力建模跨时序依赖,为工业大规模推荐模型提供了全新的序列表示范式。快手(2604.15739)则以一篇理论短文正式证明 k-token AR-NTP 在 bijective 分词下严格等价于全词表 MLE,首次为生成式推荐的工业实践提供严格数学基础。
技术趋势上,「表征质量」成为工业推荐系统的新优化焦点,有效秩、量化压缩与 sample-level 粒度三条路径同步推进;生成式推荐正从工程探索走向理论自洽;此外 RL 驱动的测试时增强(AdaTTA)和多智能体推荐过滤等方向也值得持续跟踪。
重点论文
RankUp · ⭐ 8/10
RankUp: Towards High-rank Representations for Large Scale Advertising Recommender Systems
🏢 Tencent · 判别式推荐
RankUp 通过随机置换分片、多嵌入表、全局 token、跨域嵌入融合与任务专属 token 五个机制提升工业排序器的 Effective Rank,在微信三大广告场景 100% 部署并带来 3.41–4.81% GMV 提升。
SIF · ⭐ 8/10
🏢 Meituan · 判别式推荐
通过离线 HGAQ 把每条历史交互的完整 Raw Sample 压缩为紧凑 Token Sample,再用 token-level+sample-level 分解注意力的 SIF-Mixer 建模跨时序交互,把工业排序模型的序列 token 从 item-level 升级到 sample-level。
On the Equivalence Between Auto-Regressive Next Token Prediction and Full-Item-Vocabulary Maximum Likelihood Estimation in Generative Recommendation--A Short Note · ⭐ 7/10
🏢 Kuaishou · 生成式推荐
形式化证明 k-token AR-NTP 在 bijective 分词下严格等价于全词表 MLE,首次给出工业 GR 范式的严格理论基础,并推广到级联与并行两种分词。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| RankUp | RankUp: Towards High-rank Representations for Large Scale Advertising Recommender Systems | 判别式 | 🏢 Tencent | 0 | 8 |
| SIF | Sample Is Feature: Beyond Item-Level, Toward Sample-Level Tokens for Unified Large Recommender Models | 判别式 | 🏢 Meituan | 0 | 8 |
| — | On the Equivalence Between Auto-Regressive Next Token Prediction and Full-Item-Vocabulary Maximum Likelihood Estimation in Generative Recommendation--A Short Note | 生成式 | 🏢 Kuaishou | 0 | 7 |
| HORIZON | HORIZON: A Benchmark for In-the-wild User Behaviour Modeling | 判别式 | 🎓 学术 | 6 | — |
| AdaTTA | Beyond One-Size-Fits-All: Adaptive Test-Time Augmentation for Sequential Recommendation | 判别式 | 🎓 学术 | 6 | — |
| FedCRF | FedCRF: A Federated Cross-domain Recommendation Method with Semantic-driven Deep Knowledge Fusion | 判别式 | 🎓 学术 | 5 | — |
| CognitiveGuard | Visual Inception: Compromising Long-term Planning in Agentic Recommenders via Multimodal Memory Poisoning | 其他 | 🎓 学术 | 5 | — |
| IPCCF | Intent Propagation Contrastive Collaborative Filtering | 判别式 | 🎓 学术 | 4 | — |
| HeadRank | HeadRank: Decoding-Free Passage Reranking via Preference-Aligned Attention Heads | LLM | 🎓 学术 | 4 | — |
| AdaRankLLM | Rethinking the Necessity of Adaptive Retrieval-Augmented Generation through the Lens of Adaptive Listwise Ranking | LLM | 🎓 学术 | 4 | — |
| — | Transparent and Controllable Recommendation Filtering via Multimodal Multi-Agent Collaboration | 其他 | 🎓 学术 | 4 | — |
| LAnR | Latent Abstraction for Retrieval-Augmented Generation | LLM | 🎓 学术 | 4 | — |