2026-05-25 日报
主题: 工业推荐的规模化扩展与长尾冷启动
标签: parameter-scaling · industrial · cold-start · semantic-id
📊 统计: 共 8 篇 · 精读 3 · 🏢 工业界 3 · 🎓 学术 5 · discriminative-rec 4 · generative-rec 1 · llm 2 · other 1
综述
今日共 8 篇:判别式推荐 4、生成式推荐 1、LLM 2、其他 1;3 篇精读全为工业界(阿里/Netflix/腾讯),5 篇略读偏学术。Netflix 把生成式推荐骨干从 2M 扩到 1B,提出任务相关 offset 幂律 scaling law 作“还有多少剩余空间”的诊断,并配采样 softmax、d/8 解码头、多 token 预测与语义物品塔把规模红利传导到下游,1B 全面胜出、冷启动 +28.1%。阿里天猫 AKT-Rec 用高碰撞 RQ-VAE 把 LLM 语义表示聚成语义簇,经 stop-gradient 非对称 InfoNCE 实现头→尾单向知识迁移,不损头部精度提升长尾,线上 GMV +3.47%。腾讯 RankElastor 从有效秩动力学诊断 RankMixer 嵌入坍缩,以“多扩张、少收缩”优化稠密参数 scaling,Criteo/Avazu 上 AUC 提升达 0.001。当日主线是 parameter-scaling:工业侧聚焦规模红利的工程化传导,学术侧(香农 scaling law、稀疏特征非对称 scaling)刻画其机理;语义 ID 与长尾冷启动仍是落地热点。
重点论文
AKT-Rec · ⭐ 7/10
🏢 Alibaba · 判别式推荐
阿里天猫提出 AKT-Rec,用高碰撞 RQ-VAE 把 LLM/MLLM 语义表示聚成语义簇,通过 stop-gradient 非对称 InfoNCE 实现头→尾单向知识迁移 + 活跃度双层门控,在不损头部精度下提升长尾 CTR,线上 GMV +3.47%。
Towards Generalizable and Efficient Large-Scale Generative Recommenders · ⭐ 7/10
🏢 Netflix · 生成式推荐
Netflix 把生成式推荐骨干从 2M 缩放到 1B,把模型规模降格为生产迁移问题里的一个变量:提出任务相关的 offset 幂律 scaling law 作为'哪些任务还有剩余空间'的诊断,并用采样 softmax+投影 d/8 解码头(降重训成本)、多 token 预测(对齐缓存服务的标签错配)、语义物品塔+协同 embedding 掩码(冷启动)把规模红利传导到下游;1M 用户一周生产 shadow 中 1B 全面优于 2M,冷启动 +28.1%。
RankElastor · ⭐ 7/10
Expand More, Shrink Less: Shaping Effective-Rank Dynamics for Dense Scaling in Recommendation
🏢 Tencent · 判别式推荐
从有效秩动力学视角诊断 RankMixer 的嵌入坍缩(token mixing 扩张、P-FFN 收缩的阻尼振荡轨迹),提出 RankElastor 用参数化全混合 + GLU 改进 P-FFN 实现'多扩张、少收缩',在 Criteo/Avazu 上 AUC 提升达 0.001 并展现更优稠密参数 scaling。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| AKT-Rec | From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs | 判别式 | 🏢 Alibaba | 8 | 7 |
| — | Towards Generalizable and Efficient Large-Scale Generative Recommenders | 生成式 | 🏢 Netflix | 8 | 7 |
| RankElastor | Expand More, Shrink Less: Shaping Effective-Rank Dynamics for Dense Scaling in Recommendation | 判别式 | 🏢 Tencent | 8 | 7 |
| Shannon Scaling Law | LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws | LLM | 🎓 学术 | 6 | — |
| Ocean4Rec | Ocean4Rec: Offline LLM-Derived OCEAN Profiles for Request-Time VOD Reranking | 判别式 | 🎓 学术 | 6 | — |
| EVA | EVA: Accelerating LLM Decoding via an Efficient Vector Quantization Architecture | LLM | 🎓 学术 | 5 | — |
| CF-RL-TOPSIS | An Interpretable CF-RL-TOPSIS Fusion Model for Skills-Aware Talent Recommendation | 判别式 | 🎓 学术 | 4 | — |
| — | Asymmetric Scaling Laws from Sparse Features | 其他 | 🎓 学术 | 4 | — |