← 返回报告列表

2026-05-26 日报

日报 📅 2026-05-23 ~ 2026-05-25
工业推荐系统:测试时扩展、生成式重排与效率优化
industrial feature-interaction semantic-id ad-rec test-time-training
📊 共 15 篇 · 精读 6

2026-05-26 日报

主题: 工业推荐系统:测试时扩展、生成式重排与效率优化

标签: industrial · feature-interaction · semantic-id · ad-rec · test-time-training

📊 统计: 共 15 篇 · 精读 6 · 🏢 工业界 5 · 🎓 学术 10 · discriminative-rec 8 · llm 3 · generative-rec 2 · other 2

综述

今日 15 篇,精读 6 篇;判别式推荐 8、生成式推荐 2、LLM 3、其他 2,工业界(阿里/腾讯/蚂蚁/Taboola)为精读主力。阿里 UTTSI 是首个免训练、模型无关的测试时计算扩展框架,按实例不确定性分配特征探索路径,线上 +5.3% CTR;阿里 DeGRe 用前瞻评估器离线挖掘高价值排列并混合蒸馏稠密监督,单次贪心解码逼近全局最优,淘宝闪购 GMV +3.75%;腾讯 SIREN 把多模态信号由晚融合改为 item 级早融合(SemID+相似度桶),微信广告全量上线 GMV +1.61%~3.87%;阿里 HeteGenCTR 以自平衡梯度纠正扩散式 CTR 预训练的难易域失衡(+4.7% CTR);Taboola rDCN 借上下文/目标特征秩不对称把上下文计算降至每请求一次,单 pod 吞吐 +87.5%。趋势上,LLM 的测试时扩展与生成式范式正加速迁入工业推荐,而效率/成本优化(秩分解、SemID 硬检索、单次解码)成为落地关键;蚂蚁 PowLU 则关注 FP8 低精度大模型训练稳定。

重点论文

UTTSI · ⭐ 8/10

Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration

🏢 Alibaba · 判别式推荐

UTTSI 是首个免训练、模型无关的测试时计算扩展框架,用双信号(logit置信+频率先验attribution加权)估计 per-instance 不确定性并按比例分配 K(x) 条特征探索路径,把 LLM 的 test-time scaling 迁移到工业 CTR,7 天线上 A/B 取得 +5.3% CTR。

DeGRe · ⭐ 8/10

DeGRe: Dense-supervised Generative Reranking for Recommendation

🏢 Alibaba · 生成式推荐

提出 DeGRe:基于累积回归的前瞻评估器用 beam search 离线挖掘未曝光排列空间的高价值序列,再以混合蒸馏(硬标签+软标签+序列加权)把 step-wise 稠密监督灌入轻量在线生成器,离线-在线解耦下仅需一次贪心解码即可逼近全局最优,解决生成式重排的启发式标签偏差与信用分配两大问题,淘宝闪购线上 GMV +3.75%。

SIREN · ⭐ 8/10

SIREN: Unified Multi-Granularity Semantic Interaction for Multi-Modal Lifelong User Interest Modeling

🏢 Tencent · 判别式推荐

SIREN 把多模态信号从'晚融合'改为 item 级'早融合':用 prefix-encoded SemID(刻画语义)+ target-aware 相似度桶(刻画相关性)两路互补边信息,与 ID 协同特征在 target-conditioned 注意力内统一交互;GSU 另提供 SemID 硬检索把在线成本降 90%+。腾讯微信广告全量上线,三场景 GMV +1.61%~+3.87%。

HeteGenCTR · ⭐ 7/10

Self-Balancing Gradient Allocation for Heterogeneity-Aware Feature Generation in Click-Through Rate Prediction

🏢 Alibaba · 判别式推荐

提出 HeteGenCTR:用一组 per-field 可学难度标量(源自不确定性加权)同时驱动自平衡损失与难度引导注意力,纠正离散扩散生成式 CTR 预训练中易域主导梯度、难域(ID/序列)欠拟合的不均衡;五基准+7天线上A/B(+4.7% CTR,冷启动+9.2%)验证。

rDCN · ⭐ 7/10

Context Features Are Cheap: Rank-Aware Decomposition for Efficient Feature Interaction in Recommender Systems

🎓 学术 · 判别式推荐

提出 rank-aware 分解:利用上下文(rank-2,跨候选共享)与目标(rank-3,逐候选)特征的秩不对称,把上下文-only 计算从每候选一次降到每请求一次,对 FM/FC/DCNv2/attention 精确等价,Taboola 生产 DLRM 排序器单 pod 吞吐 +87.5%(p99 -33%);并提出贯穿全深度的架构变体 rDCN(省 67% FLOPs)。

全部论文

模型 标题 类别 公司 摘要分 精读分
UTTSI Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration 判别式 🏢 Alibaba 8 8
DeGRe DeGRe: Dense-supervised Generative Reranking for Recommendation 生成式 🏢 Alibaba 8 8
SIREN SIREN: Unified Multi-Granularity Semantic Interaction for Multi-Modal Lifelong User Interest Modeling 判别式 🏢 Tencent 8 8
HeteGenCTR Self-Balancing Gradient Allocation for Heterogeneity-Aware Feature Generation in Click-Through Rate Prediction 判别式 🏢 Alibaba 8 7
PowLU PowLU: An Activation Function for Stable Pre-Training of LLMs LLM 🏢 Ant Group 7 7
rDCN Context Features Are Cheap: Rank-Aware Decomposition for Efficient Feature Interaction in Recommender Systems 判别式 🎓 学术 7 7
How Reliable Are Semantic-ID Tokenizer Comparisons in Generative Recommendation? 生成式 🎓 学术 7
UNSL Unified Neural Scaling Laws LLM 🎓 学术 7
LENS LENS: A Staged Design for Interaction Granularity in Sequential CTR Prediction 判别式 🎓 学术 6
MMA Meta-Modal Agent: Sequential Evidence Routing for Missing-Modality Candidate Reranking 判别式 🎓 学术 6
GCIB GCIB: Graph Contrastive Information Bottleneck for Multi-Behavior Recommendation 判别式 🎓 学术 5
SMART Your Embedding Model is SMARTer Than You Think 其他 🎓 学术 5
CVQ Channel-wise Vector Quantization 其他 🎓 学术 5
Mapping the Schedule x Bit-Width Boundary in Sub-100M Quantisation-Aware Training LLM 🎓 学术 4
RankAid First, do no harm: Breaking suicidogenic echo chambers in media recommendation 判别式 🎓 学术 4