2026-05-26 日报
主题: 工业推荐系统:测试时扩展、生成式重排与效率优化
标签: industrial · feature-interaction · semantic-id · ad-rec · test-time-training
📊 统计: 共 15 篇 · 精读 6 · 🏢 工业界 5 · 🎓 学术 10 · discriminative-rec 8 · llm 3 · generative-rec 2 · other 2
综述
今日 15 篇,精读 6 篇;判别式推荐 8、生成式推荐 2、LLM 3、其他 2,工业界(阿里/腾讯/蚂蚁/Taboola)为精读主力。阿里 UTTSI 是首个免训练、模型无关的测试时计算扩展框架,按实例不确定性分配特征探索路径,线上 +5.3% CTR;阿里 DeGRe 用前瞻评估器离线挖掘高价值排列并混合蒸馏稠密监督,单次贪心解码逼近全局最优,淘宝闪购 GMV +3.75%;腾讯 SIREN 把多模态信号由晚融合改为 item 级早融合(SemID+相似度桶),微信广告全量上线 GMV +1.61%~3.87%;阿里 HeteGenCTR 以自平衡梯度纠正扩散式 CTR 预训练的难易域失衡(+4.7% CTR);Taboola rDCN 借上下文/目标特征秩不对称把上下文计算降至每请求一次,单 pod 吞吐 +87.5%。趋势上,LLM 的测试时扩展与生成式范式正加速迁入工业推荐,而效率/成本优化(秩分解、SemID 硬检索、单次解码)成为落地关键;蚂蚁 PowLU 则关注 FP8 低精度大模型训练稳定。
重点论文
UTTSI · ⭐ 8/10
🏢 Alibaba · 判别式推荐
UTTSI 是首个免训练、模型无关的测试时计算扩展框架,用双信号(logit置信+频率先验attribution加权)估计 per-instance 不确定性并按比例分配 K(x) 条特征探索路径,把 LLM 的 test-time scaling 迁移到工业 CTR,7 天线上 A/B 取得 +5.3% CTR。
DeGRe · ⭐ 8/10
DeGRe: Dense-supervised Generative Reranking for Recommendation
🏢 Alibaba · 生成式推荐
提出 DeGRe:基于累积回归的前瞻评估器用 beam search 离线挖掘未曝光排列空间的高价值序列,再以混合蒸馏(硬标签+软标签+序列加权)把 step-wise 稠密监督灌入轻量在线生成器,离线-在线解耦下仅需一次贪心解码即可逼近全局最优,解决生成式重排的启发式标签偏差与信用分配两大问题,淘宝闪购线上 GMV +3.75%。
SIREN · ⭐ 8/10
🏢 Tencent · 判别式推荐
SIREN 把多模态信号从'晚融合'改为 item 级'早融合':用 prefix-encoded SemID(刻画语义)+ target-aware 相似度桶(刻画相关性)两路互补边信息,与 ID 协同特征在 target-conditioned 注意力内统一交互;GSU 另提供 SemID 硬检索把在线成本降 90%+。腾讯微信广告全量上线,三场景 GMV +1.61%~+3.87%。
HeteGenCTR · ⭐ 7/10
🏢 Alibaba · 判别式推荐
提出 HeteGenCTR:用一组 per-field 可学难度标量(源自不确定性加权)同时驱动自平衡损失与难度引导注意力,纠正离散扩散生成式 CTR 预训练中易域主导梯度、难域(ID/序列)欠拟合的不均衡;五基准+7天线上A/B(+4.7% CTR,冷启动+9.2%)验证。
rDCN · ⭐ 7/10
🎓 学术 · 判别式推荐
提出 rank-aware 分解:利用上下文(rank-2,跨候选共享)与目标(rank-3,逐候选)特征的秩不对称,把上下文-only 计算从每候选一次降到每请求一次,对 FM/FC/DCNv2/attention 精确等价,Taboola 生产 DLRM 排序器单 pod 吞吐 +87.5%(p99 -33%);并提出贯穿全深度的架构变体 rDCN(省 67% FLOPs)。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| UTTSI | Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration | 判别式 | 🏢 Alibaba | 8 | 8 |
| DeGRe | DeGRe: Dense-supervised Generative Reranking for Recommendation | 生成式 | 🏢 Alibaba | 8 | 8 |
| SIREN | SIREN: Unified Multi-Granularity Semantic Interaction for Multi-Modal Lifelong User Interest Modeling | 判别式 | 🏢 Tencent | 8 | 8 |
| HeteGenCTR | Self-Balancing Gradient Allocation for Heterogeneity-Aware Feature Generation in Click-Through Rate Prediction | 判别式 | 🏢 Alibaba | 8 | 7 |
| PowLU | PowLU: An Activation Function for Stable Pre-Training of LLMs | LLM | 🏢 Ant Group | 7 | 7 |
| rDCN | Context Features Are Cheap: Rank-Aware Decomposition for Efficient Feature Interaction in Recommender Systems | 判别式 | 🎓 学术 | 7 | 7 |
| — | How Reliable Are Semantic-ID Tokenizer Comparisons in Generative Recommendation? | 生成式 | 🎓 学术 | 7 | — |
| UNSL | Unified Neural Scaling Laws | LLM | 🎓 学术 | 7 | — |
| LENS | LENS: A Staged Design for Interaction Granularity in Sequential CTR Prediction | 判别式 | 🎓 学术 | 6 | — |
| MMA | Meta-Modal Agent: Sequential Evidence Routing for Missing-Modality Candidate Reranking | 判别式 | 🎓 学术 | 6 | — |
| GCIB | GCIB: Graph Contrastive Information Bottleneck for Multi-Behavior Recommendation | 判别式 | 🎓 学术 | 5 | — |
| SMART | Your Embedding Model is SMARTer Than You Think | 其他 | 🎓 学术 | 5 | — |
| CVQ | Channel-wise Vector Quantization | 其他 | 🎓 学术 | 5 | — |
| — | Mapping the Schedule x Bit-Width Boundary in Sub-100M Quantisation-Aware Training | LLM | 🎓 学术 | 4 | — |
| RankAid | First, do no harm: Breaking suicidogenic echo chambers in media recommendation | 判别式 | 🎓 学术 | 4 | — |