2026-06-19 日报
主题: 大模型表征的结构化与冗余精简
标签: semantic-id · knowledge-distillation · transformer · industrial · pretrained-lm
📊 统计: 共 3 篇 · 精读 1 · 🏢 工业界 1 · 🎓 学术 2 · generative-rec 1 · llm 2
综述
当日共 3 篇,1 篇精读、2 篇速读;类别上生成式推荐 1 篇、LLM 2 篇,工业界仅 Meta 1 篇,其余为学术。重点是 G2Rec(Meta):消去 user 节点构造稀疏 item 共参与图,谱稀疏化把边压到 O(M log M),在图上做可微软模块度聚类得到每个 item 的兴趣原型软成员,再把连续兴趣画像 token 与 item 嵌入交替成序列喂 Llama2-13B 自回归推荐器,已在 Meta 多场景上线,是当日唯一工业级落地。MAA 提出边际优势累积,用 EMA 累积每个记忆操作的有符号证据并做语义身份合并,区分稳定有效操作与偶然命中,在 16 个设置中 14 个最佳、优化阶段 token 消耗降约 75%。VLA 压缩工作揭示 pi_0、GR00T-N1.5 等基础策略存在层间表征冗余,用单次前向加 CKA 识别并删除孪生层,深度压缩最多 50%、推理提速最多 30% 而性能不降。整体趋势是把大模型表征结构化(图聚类得兴趣原型)与冗余精简(层删除、记忆蒸馏)结合,在推荐、机器人、agent 记忆三类系统上以更少参数算力维持效果;Llama 主干加兴趣 token 化仍是生成式推荐主路线,值得持续关注。
重点论文
G2Rec · ⭐ 8/10
Structuring and Tokenizing Distributed User Interest Context for Generative Recommendation
🏢 Meta · 生成式推荐
提出 G2Rec:消去 user 节点构造稀疏 item 共参与图(O(M log M) 边,谱稀疏化有保证),在图上做可微软模块度聚类得到每个 item 的兴趣原型软成员,把连续兴趣画像 token 与 item 嵌入交替成序列喂 Llama2-13B 自回归推荐器,在 Meta 多场景上线。
MAA · ⭐ 4/10
Marginal Advantage Accumulation for Memory-Driven Agent Self-Evolution
🎓 学术 · LLM
提出 Marginal Advantage Accumulation(MAA),一种批量轨迹蒸馏的后处理架构,通过构造差分信号使跨批次可比、用 EMA 累积每个记忆操作的有符号证据并做语义身份合并,从而区分稳定有效操作与偶然命中。在 4 个 benchmark、4 个目标模型的 16 个设置中 14 个取得最佳,优化阶段 token 消耗降低约 75%。
Finetuning Vision-Language-Action Models Requires Fewer Layers Than You Think · ⭐ 4/10
🎓 学术 · LLM
揭示 VLA 基础模型(如 pi_0、GR00T-N1.5)存在严重的层间表示冗余,提出一种完全免训练的结构压缩流程,仅用单次前向经 CKA 识别冗余层并删除“孪生层”,将模型深度压缩最多 50%,在多个仿真与真实机器人任务上保持甚至超过原模型性能,训练时间降低 40-50%、推理加速最多 30%。
全部论文
| 模型 | 标题 | 类别 | 公司 | 摘要分 | 精读分 |
|---|---|---|---|---|---|
| G2Rec | Structuring and Tokenizing Distributed User Interest Context for Generative Recommendation | 生成式 | 🏢 Meta | 8 | 8 |
| MAA | Marginal Advantage Accumulation for Memory-Driven Agent Self-Evolution | LLM | 🎓 学术 | 4 | — |
| — | Finetuning Vision-Language-Action Models Requires Fewer Layers Than You Think | LLM | 🎓 学术 | 4 | — |