2026-06-04 日报

主题: 大模型语义表征与行为基础模型 scaling 重塑工业推荐

标签: pretrained-lm · semantic-id · parameter-scaling · industrial

📊 统计: 共 11 篇 · 精读 3 · 🏢 工业界 2 · 🎓 学术 9 · generative-rec 1 · discriminative-rec 3 · other 3 · llm 4

综述

今日共收录 11 篇,类别分布为生成式推荐 2、判别式推荐 3、LLM 4、其他 2,其中 2 篇工业论文经过精读,整体呈工业重磅与学术探索并行之势。快手 RGCD-Rep 把冻结大教师 MLLM 的结构化跨域推理蒸馏进轻量学生模型,经“可迁移残差”查询感知聚合与行为/语义双信号路由,学出可离线落库的短视频→直播跨域表征,已全量服务 4 亿+日活;阿里 DSIRM 把语义 ID 从生成式检索目标重新定位为电商排序的离散相关性特征,用 query 桥接对比 RQ-VAE(类目感知首层码本)学相关性感知 item SID 并微调 Qwen 生成 query SID,天猫离线 AUC +1.54%、线上 UCTR/UCTCVR 双升。Gabrielsson 在约 600 次实验、10^15–10^19 FLOPs 上给出“行为基础模型”的 scaling law,发现嵌入器仅需约 2%参数即计算最优,且评测指标本身会改变最优配方。整体看,大模型语义与推理表征正从离线特征走向可落库的工业组件,基础模型 scaling 与语义 ID 成为贯通学术与工业的两条主线。

重点论文

RGCD-Rep · ⭐ 8/10

Bridging Short Videos and Live Streams: Reasoning-Guided Multimodal LLMs for Cross-Domain Representation Learning

🏢 Kuaishou · 生成式推荐

快手 RGCD-Rep 用冻结大教师 MLLM 生成结构化跨域推理并蒸馏进轻量学生 MLLM,经 transferable-residual 查询感知聚合 + 行为/语义双信号路由学出可离线落库的短视频→直播跨域可迁移表征,全量部署服务 4 亿+ 日活。

Scaling Laws for Behavioral Foundation Models over User Event Sequences · ⭐ 8/10

🎓 学术 · 其他

用约600次iso-FLOP训练(10^15-10^19 FLOPs)系统标定行为基础模型(特征事件嵌入器+decoder-only Transformer预测下一事件)的scaling law:计算最优嵌入器仅约2%参数、行为模型低算力下数据偏多(D/N约340)并随算力向Chinchilla收窄(到36)、且评测指标本身是scaling law的一部分——sampled-softmax训练loss不是full-catalogue排序质量的可靠代理,换指标会改变计算最优配方。

DSIRM · ⭐ 7/10

DSIRM: Learning Query-Bridged Discrete Semantic Identifiers for E-commerce Relevance Modeling

🏢 Alibaba · 判别式推荐

DSIRM 把语义 ID 从生成式检索目标重新定位为电商排序的离散相关性特征——用 query 桥接对比 RQ-VAE（类目感知首层码本）学相关性感知的 item SID、微调 Qwen 生成 query SID，二者层级前缀匹配分增强排序 DNN，天猫离线 AUC +1.54%、线上 UCTR/UCTCVR +0.13%/+0.25%。

全部论文

模型	标题	类别	公司	摘要分	精读分
RGCD-Rep	Bridging Short Videos and Live Streams: Reasoning-Guided Multimodal LLMs for Cross-Domain Representation Learning	生成式	🏢 Kuaishou	8	8
—	Scaling Laws for Behavioral Foundation Models over User Event Sequences	其他	🎓 学术	8	8
DSIRM	DSIRM: Learning Query-Bridged Discrete Semantic Identifiers for E-commerce Relevance Modeling	判别式	🏢 Alibaba	8	7
DINOSAUR	Distributional Approximate Nearest Neighbour Search for Uncertainty-Aware Retrieval	判别式	🎓 学术	6	—
DS-MLP	Dual-Stream MLP is All You Need for CTR Prediction	判别式	🎓 学术	6	—
TAP-PER	Beyond Retrieval: Learning Compact User Representations for Scalable LLM Personalization	LLM	🎓 学术	6	—
SAILRec	SAILRec: Steering LLM Attention to Dual-Side Semantically Aligned Collaborative Embeddings for Recommendation	LLM	🎓 学术	6	—
BEATS	BEATS: Bootstrapping E-commerce Attribute Taxonomies for Search through Iterative Human-AI Collaboration	其他	🎓 学术	5	—
MAPL	Learned Subspace Compression for Communication-Efficient Pipeline Parallelism	LLM	🎓 学术	5	—
StreamMA	Streaming Communication in Multi-Agent Reasoning	LLM	🎓 学术	4	—
—	Trading Engagement for Sustainability: Carbon-Aware Re-ranking for E-commerce Recommendations	其他	🎓 学术	4	—