2026-05-26 日报

主题: 工业推荐系统:测试时扩展、生成式重排与效率优化

标签: industrial · feature-interaction · semantic-id · ad-rec · test-time-training

📊 统计: 共 15 篇 · 精读 6 · 🏢 工业界 5 · 🎓 学术 10 · discriminative-rec 8 · llm 3 · generative-rec 2 · other 2

综述

今日 15 篇,精读 6 篇;判别式推荐 8、生成式推荐 2、LLM 3、其他 2,工业界(阿里/腾讯/蚂蚁/Taboola)为精读主力。阿里 UTTSI 是首个免训练、模型无关的测试时计算扩展框架,按实例不确定性分配特征探索路径,线上 +5.3% CTR;阿里 DeGRe 用前瞻评估器离线挖掘高价值排列并混合蒸馏稠密监督,单次贪心解码逼近全局最优,淘宝闪购 GMV +3.75%;腾讯 SIREN 把多模态信号由晚融合改为 item 级早融合(SemID+相似度桶),微信广告全量上线 GMV +1.61%~3.87%;阿里 HeteGenCTR 以自平衡梯度纠正扩散式 CTR 预训练的难易域失衡(+4.7% CTR);Taboola rDCN 借上下文/目标特征秩不对称把上下文计算降至每请求一次,单 pod 吞吐 +87.5%。趋势上,LLM 的测试时扩展与生成式范式正加速迁入工业推荐,而效率/成本优化(秩分解、SemID 硬检索、单次解码)成为落地关键;蚂蚁 PowLU 则关注 FP8 低精度大模型训练稳定。

重点论文

UTTSI · ⭐ 8/10

Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration

🏢 Alibaba · 判别式推荐

UTTSI 是首个免训练、模型无关的测试时计算扩展框架,用双信号(logit置信+频率先验attribution加权)估计 per-instance 不确定性并按比例分配 K(x) 条特征探索路径,把 LLM 的 test-time scaling 迁移到工业 CTR,7 天线上 A/B 取得 +5.3% CTR。

DeGRe · ⭐ 8/10

DeGRe: Dense-supervised Generative Reranking for Recommendation

🏢 Alibaba · 生成式推荐

提出 DeGRe:基于累积回归的前瞻评估器用 beam search 离线挖掘未曝光排列空间的高价值序列,再以混合蒸馏(硬标签+软标签+序列加权)把 step-wise 稠密监督灌入轻量在线生成器,离线-在线解耦下仅需一次贪心解码即可逼近全局最优,解决生成式重排的启发式标签偏差与信用分配两大问题,淘宝闪购线上 GMV +3.75%。

SIREN · ⭐ 8/10

SIREN: Unified Multi-Granularity Semantic Interaction for Multi-Modal Lifelong User Interest Modeling

🏢 Tencent · 判别式推荐

SIREN 把多模态信号从'晚融合'改为 item 级'早融合':用 prefix-encoded SemID(刻画语义)+ target-aware 相似度桶(刻画相关性)两路互补边信息,与 ID 协同特征在 target-conditioned 注意力内统一交互;GSU 另提供 SemID 硬检索把在线成本降 90%+。腾讯微信广告全量上线,三场景 GMV +1.61%~+3.87%。

HeteGenCTR · ⭐ 7/10

Self-Balancing Gradient Allocation for Heterogeneity-Aware Feature Generation in Click-Through Rate Prediction

🏢 Alibaba · 判别式推荐

提出 HeteGenCTR:用一组 per-field 可学难度标量(源自不确定性加权)同时驱动自平衡损失与难度引导注意力,纠正离散扩散生成式 CTR 预训练中易域主导梯度、难域(ID/序列)欠拟合的不均衡;五基准+7天线上A/B(+4.7% CTR,冷启动+9.2%)验证。

rDCN · ⭐ 7/10

Context Features Are Cheap: Rank-Aware Decomposition for Efficient Feature Interaction in Recommender Systems

🎓 学术 · 判别式推荐

提出 rank-aware 分解:利用上下文(rank-2,跨候选共享)与目标(rank-3,逐候选)特征的秩不对称,把上下文-only 计算从每候选一次降到每请求一次,对 FM/FC/DCNv2/attention 精确等价,Taboola 生产 DLRM 排序器单 pod 吞吐 +87.5%(p99 -33%);并提出贯穿全深度的架构变体 rDCN(省 67% FLOPs)。

全部论文

模型	标题	类别	公司	摘要分	精读分
UTTSI	Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration	判别式	🏢 Alibaba	8	8
DeGRe	DeGRe: Dense-supervised Generative Reranking for Recommendation	生成式	🏢 Alibaba	8	8
SIREN	SIREN: Unified Multi-Granularity Semantic Interaction for Multi-Modal Lifelong User Interest Modeling	判别式	🏢 Tencent	8	8
HeteGenCTR	Self-Balancing Gradient Allocation for Heterogeneity-Aware Feature Generation in Click-Through Rate Prediction	判别式	🏢 Alibaba	8	7
PowLU	PowLU: An Activation Function for Stable Pre-Training of LLMs	LLM	🏢 Ant Group	7	7
rDCN	Context Features Are Cheap: Rank-Aware Decomposition for Efficient Feature Interaction in Recommender Systems	判别式	🎓 学术	7	7
—	How Reliable Are Semantic-ID Tokenizer Comparisons in Generative Recommendation?	生成式	🎓 学术	7	—
UNSL	Unified Neural Scaling Laws	LLM	🎓 学术	7	—
LENS	LENS: A Staged Design for Interaction Granularity in Sequential CTR Prediction	判别式	🎓 学术	6	—
MMA	Meta-Modal Agent: Sequential Evidence Routing for Missing-Modality Candidate Reranking	判别式	🎓 学术	6	—
GCIB	GCIB: Graph Contrastive Information Bottleneck for Multi-Behavior Recommendation	判别式	🎓 学术	5	—
SMART	Your Embedding Model is SMARTer Than You Think	其他	🎓 学术	5	—
CVQ	Channel-wise Vector Quantization	其他	🎓 学术	5	—
—	Mapping the Schedule x Bit-Width Boundary in Sub-100M Quantisation-Aware Training	LLM	🎓 学术	4	—
RankAid	First, do no harm: Breaking suicidogenic echo chambers in media recommendation	判别式	🎓 学术	4	—