2026-05-25 日报

主题: 工业推荐的规模化扩展与长尾冷启动

标签: parameter-scaling · industrial · cold-start · semantic-id

📊 统计: 共 8 篇 · 精读 3 · 🏢 工业界 3 · 🎓 学术 5 · discriminative-rec 4 · generative-rec 1 · llm 2 · other 1

综述

今日共 8 篇:判别式推荐 4、生成式推荐 1、LLM 2、其他 1;3 篇精读全为工业界(阿里/Netflix/腾讯),5 篇略读偏学术。Netflix 把生成式推荐骨干从 2M 扩到 1B,提出任务相关 offset 幂律 scaling law 作“还有多少剩余空间”的诊断,并配采样 softmax、d/8 解码头、多 token 预测与语义物品塔把规模红利传导到下游,1B 全面胜出、冷启动 +28.1%。阿里天猫 AKT-Rec 用高碰撞 RQ-VAE 把 LLM 语义表示聚成语义簇,经 stop-gradient 非对称 InfoNCE 实现头→尾单向知识迁移,不损头部精度提升长尾,线上 GMV +3.47%。腾讯 RankElastor 从有效秩动力学诊断 RankMixer 嵌入坍缩,以“多扩张、少收缩”优化稠密参数 scaling,Criteo/Avazu 上 AUC 提升达 0.001。当日主线是 parameter-scaling:工业侧聚焦规模红利的工程化传导,学术侧(香农 scaling law、稀疏特征非对称 scaling)刻画其机理;语义 ID 与长尾冷启动仍是落地热点。

重点论文

AKT-Rec · ⭐ 7/10

From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs

🏢 Alibaba · 判别式推荐

阿里天猫提出 AKT-Rec,用高碰撞 RQ-VAE 把 LLM/MLLM 语义表示聚成语义簇,通过 stop-gradient 非对称 InfoNCE 实现头→尾单向知识迁移 + 活跃度双层门控,在不损头部精度下提升长尾 CTR,线上 GMV +3.47%。

Towards Generalizable and Efficient Large-Scale Generative Recommenders · ⭐ 7/10

🏢 Netflix · 生成式推荐

Netflix 把生成式推荐骨干从 2M 缩放到 1B,把模型规模降格为生产迁移问题里的一个变量:提出任务相关的 offset 幂律 scaling law 作为'哪些任务还有剩余空间'的诊断,并用采样 softmax+投影 d/8 解码头(降重训成本)、多 token 预测(对齐缓存服务的标签错配)、语义物品塔+协同 embedding 掩码(冷启动)把规模红利传导到下游;1M 用户一周生产 shadow 中 1B 全面优于 2M,冷启动 +28.1%。

RankElastor · ⭐ 7/10

Expand More, Shrink Less: Shaping Effective-Rank Dynamics for Dense Scaling in Recommendation

🏢 Tencent · 判别式推荐

从有效秩动力学视角诊断 RankMixer 的嵌入坍缩(token mixing 扩张、P-FFN 收缩的阻尼振荡轨迹),提出 RankElastor 用参数化全混合 + GLU 改进 P-FFN 实现'多扩张、少收缩',在 Criteo/Avazu 上 AUC 提升达 0.001 并展现更优稠密参数 scaling。

全部论文

模型	标题	类别	公司	摘要分	精读分
AKT-Rec	From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs	判别式	🏢 Alibaba	8	7
—	Towards Generalizable and Efficient Large-Scale Generative Recommenders	生成式	🏢 Netflix	8	7
RankElastor	Expand More, Shrink Less: Shaping Effective-Rank Dynamics for Dense Scaling in Recommendation	判别式	🏢 Tencent	8	7
Shannon Scaling Law	LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws	LLM	🎓 学术	6	—
Ocean4Rec	Ocean4Rec: Offline LLM-Derived OCEAN Profiles for Request-Time VOD Reranking	判别式	🎓 学术	6	—
EVA	EVA: Accelerating LLM Decoding via an Efficient Vector Quantization Architecture	LLM	🎓 学术	5	—
CF-RL-TOPSIS	An Interpretable CF-RL-TOPSIS Fusion Model for Skills-Aware Talent Recommendation	判别式	🎓 学术	4	—
—	Asymmetric Scaling Laws from Sparse Features	其他	🎓 学术	4	—