📅 2026-05-08 6 篇 · 精读 2
生成式推荐表达力与价值对齐双线突破
本日共收录 6 篇论文,涵盖生成式推荐 2 篇、判别式推荐 2 篇、LLM 与检索各 1 篇,工业与学术贡献各占一半。重点工作集中在生成式推荐(GR)方向:UCSD 与 Snap 联合提出的 Latte(2605.06331)从理论上揭示了自回归 Semantic ID 解码受 tree-distance 概率耦合约束、无法表达 rank-reversal 与 forced-transitivit...
semantic-idtransformerrlindustrialacademic
📅 2026-05-07 6 篇 · 精读 5
生成式推荐与服务系统全栈优化:Semantic ID、对齐与 HBM 调度协同推进
今日共 6 篇论文,5 篇精读、1 篇略读;类别上 generative-rec 占 3 篇,llm、other、discriminative-rec 各 1 篇,工业系(Alibaba 主导)与学术系基本对半。建模侧:CapsID 用 capsule 软路由替代 RQ-VAE 的硬 argmax 并配合置信驱动变长 SID 与 SemanticBPE 双门控合并,在 35M item 工业目录上...
semantic-idindustrialpretrained-lmmoequantization
📅 2026-05-06 2 篇 · 精读 0
AI 生成音乐流行度预测与 Agentic 工作流编排
本日共 2 篇论文均为学术界产出,类别分布偏向其他方向,无工业界深度精读论文。APEX(新加坡科技设计大学)基于冻结的 MERT 自监督音乐表征,在 21 万首 Suno/Udio 生成音乐上构建多任务框架,联合预测流行度信号与五维美学质量,并在 Music Arena 偏好预测上验证了美学特征对 OOD 泛化的增益。From Intent to Execution 提出一个自动化多智能体编排框架...
pretrained-lmsearch-rankingacademic
📅 2026-05-05 9 篇 · 精读 5
Scaling Laws 三连发与领域 Foundation Model 实践
本日共 9 篇论文,3 篇 LLM、3 篇判别式推荐、3 篇 other,工业(ByteDance/Meta/Tencent)与学术(Cornell/Yale/清华)各占半壁,主线集中在 Scaling Law 的精细化与跨域 Foundation Model 实践。三大 Scaling Law 工作中,ByteDance 的 InfoLaw 把训练重写为信息累积过程,用 quality dens...
parameter-scalingtransformerindustrialacademic
📅 2026-05-04 3 篇 · 精读 0
推荐系统负样本挖掘与多模态鲁棒性
本日共 3 篇推荐系统论文,2 篇判别式 + 1 篇生成式,工业与学术各占其一。DynamicPO 针对 LLM 推荐 DPO 训练中"偏好优化坍塌"现象,理论归因于 easy negatives 主导梯度,提出动态选择决策边界附近信息性负样本并按边界模糊度自适应 beta 系数,在三个公开数据集上稳定提升。IKEA.com 的稠密检索工业实践利用商品分类层级和属性构造结构化 hard negat...
contrastive-sslpretrained-lmsearch-rankingindustrialacademic
📅 2026-05-01 2 篇 · 精读 1
LLM 生成式推荐的推理加速与列表重排
今日共 2 篇论文,均聚焦 LLM 推荐方向,分布于 generative-rec 与 llm 两类,全部来自学术机构。重点论文 PAD-Rec(中科大等)针对 SID 列表式生成推荐的推理瓶颈,在 speculative decoding 草稿模型中注入 within-item slot 与 draft-step 两类位置嵌入并以轻量门控融合,使草稿端结构感知化,在四个公开数据集上获得最高 3....
pretrained-lmtransformersemantic-idsearch-rankingacademic
📅 2026-04-30 8 篇 · 精读 3
生成式与 LLM 推荐:语义 ID、压缩重排与因子化潜推理
今日共 8 篇论文,3 篇精读、5 篇略读;类别分布为判别式推荐 4 篇、生成式推荐 2 篇、LLM 检索/重排 1 篇、隐私 1 篇,整体以学术为主。重点精读三篇均围绕"生成式 / LLM 范式下的表征与推理瓶颈"展开:CARD(电子科大)把文本、视觉与协同信号渲染为统一卡牌图像,由 SigLIP2 编码后引入可学习可逆的非均匀变换(Kumaraswamy CDF / scaled logist...
semantic-idquantizationpretrained-lmrlacademic
📅 2026-04-28 16 篇 · 精读 6
Semantic ID 工业落地与长序列 KV 压缩双线推进
本日共 16 篇,6 篇精读、10 篇仅简评;按类别分布生成式推荐 4 篇、判别式推荐 3 篇、LLM 3 篇、其他 6 篇,工业-学术比约 4:12,快手、美团、苹果三家工业方贡献了最重的几篇。重点论文上,快手 KSA(2604.24432,reading_score 9)通过插入可学习 summary token 实现 O(n/k) 语义级 KV 压缩,与 GQA/MLA 完全正交可叠加 8×...
semantic-idindustrialtransformersparse-attentionparameter-scaling
📅 2026-04-27 7 篇 · 精读 3
RL 重塑 LLM 生成式推荐与检索重排
本日共 7 篇论文,3 篇精读、4 篇略读;类别分布以生成式推荐(3)与 LLM 检索(2)为主,工业(华为、阿里)与学术(USTC×Meta 等)双线并进。重点论文中,华为 ReCast 把生成式推荐 RL 的瓶颈从"奖励稀疏"前推至"group 可学性退化",用 ground-truth anchor 修复 all-zero 组并以 hardest 正负对边界对比替代全组归一化;阿里 Qwen...
rlpretrained-lmsearch-rankingindustrialacademic
📅 2026-04-24 1 篇 · 精读 0
LLM 离线知识蒸馏赋能传统序列推荐
今日仅 1 篇相关 ArXiv 提交,属学术界工作,同时归入"LLM"与"判别式推荐"两类。重点论文为 Severin 等人提出的 LLM-蒸馏序列推荐框架(arxiv 2604.21536):利用预训练 LLM 在离线阶段为用户生成文本化画像,作为额外监督信号蒸馏进传统序列推荐模型,在线服务时完全无需 LLM 推理,也不改动既有模型架构,从而在保留传统模型低延迟优势的同时引入 LLM 的语义理解...
sequential-recknowledge-distillationllm-basedacademic
📅 2026-04-23 2 篇 · 精读 0
LLM 自博弈扩展与 Agent 记忆结构化生成
本日共 2 篇 LLM 方向学术论文,均未精读,聚焦 LLM 训练扩展与 Agent 基础设施两个子方向。Scaling Self-Play with Self-Guidance(SGS,Stanford,Hashimoto/Tengyu Ma 组)在传统 Conjecturer/Solver 双角色自博弈之外引入第三方 Guide 角色,对合成问题的相关性与自然度打分以抑制 Conjecture...
llm-basedrlscalingacademic
📅 2026-04-22 7 篇 · 精读 3
工业级推荐系统的结构创新与 scaling 新维度
今日共纳入 7 篇论文,4 篇判别式推荐 + 3 篇 LLM 相关,工业-学术比约 4:3,其中 3 篇完成精读且评分均达 8 分。Alibaba 的 LoopCTR 把共享层递归复用提升为正交于深度/宽度/输入的第四种 scaling 维度,配合 Hyper-Connected Residuals、MoE 与多深度 process supervision,实现 train-multi-loop ...
ctr-predictionsequential-recscalingsemantic-idindustrial
📅 2026-04-21 12 篇 · 精读 3
工业排序表征质量提升与生成式推荐理论基础双线并进
2026-04-21 共收录 12 篇论文,判别式推荐 6 篇、LLM 方向 3 篇、其他 2 篇、生成式推荐 1 篇;精读论文 3 篇均来自国内大厂,工业落地色彩浓厚。 重点论文方面,腾讯 RankUp(2604.17878)从「有效秩」视角系统解决 MetaFormer 排序器的表征坍缩问题,提出随机置换分片、多嵌入表、全局 token 等五项机制,在微信三大广告场景实现 3.41–4.81...
ctr-predictionfeature-interactionscalingindustrialgenerative-retrieval
📅 2026-04-17 1 篇 · 精读 1
工业级生成式推荐:训练信号、序列压缩与强化对齐
2026年4月17日共收录1篇论文,类别集中于生成式推荐(generative-rec),来自工业界。 重点论文 GenRec(京东)系统性回应了大规模生成式检索在工业部署中的三大核心瓶颈:(1)训练信号稀疏——提出页粒度 NTP(Page-wise Next-Token Prediction),将有效训练信号密度显著提升;(2)语义ID序列过长——设计非对称 Token Merger,以约2倍...
generative-retrievalsemantic-idrlsequential-recindustrial
📅 2026-04-16 8 篇 · 精读 2
序列推荐统一建模与时序特征工程的多路并进
2026-04-16 共收录 8 篇推荐系统论文,判别式推荐占主导(6 篇),生成式检索与 LLM 推荐各 1 篇;工业级论文 3 篇,学术论文 5 篇。 本日最受关注的是腾讯提出的 TokenFormer(精读分 8),其核心贡献在于通过 BFTS(Bottom-Full-Top-Sliding)分层注意力与 NLIR 非线性门控机制,将多域特征交叉与序列行为建模统一到单一 Transform...
sequential-rectransformerfeature-interactionattention-mechanismindustrialacademic
📅 2026-04-13 5 篇 · 精读 1
工业级用户行为序列建模与学术推荐表示优化并行推进
今日共收录 5 篇论文,涵盖判别式推荐(4 篇)与 LLM/MoE 理论(1 篇),工业落地论文 1 篇,学术探索论文 4 篇。 重点论文为字节跳动的 **IAT**(Instance-As-Token),该工作将用户历史交互的全量特征压缩为紧凑实例 token,以两阶段解耦框架(Source Instance Transformer 压缩 + 标准序列模型建模)突破传统手工特征序列的信息瓶颈。...
sequential-recctr-predictionfeature-interactionindustrialscaling
📅 2026-04-10 7 篇 · 精读 3
工业级生成式与判别式推荐双线突破:可扩展稀疏 + 稳定嵌入
本期日报覆盖 2026-04-09 ArXiv 提交,共 7 篇推荐相关论文(3 篇精读 + 4 篇摘要归档),类别均衡分布在生成式、判别式、LLM 三大范式。三篇重点论文均来自工业 / 学术深度结合:Alibaba (AliExpress) 的 SSR 框架以显式稀疏取代 Wukong/RankMixer 的密集架构,在亿级 CTR 数据上实现真正的 scaling law,连续超越 RankM...
industrialscalingfeature-interactionrlllm-based
📅 2026-04-09 2 篇 · 精读 0
冷启动与 persona 建模成为今日推荐议题主线
今日 7 篇候选均未达到精读门槛(>=7)。两篇进入摘要归档:ACARec 用 artist catalog attention 解决音乐冷启动,将问题重构为 semi-cold 范式,相比纯内容基线 Recall/NDCG 翻倍,方法清晰但偏应用向;persona-driven SBRS 把 LLM 物品嵌入与异构 KG 融合,通过 HDGI 学习匿名 session 的 latent pers...
cold-startsequential-recllm-based
📅 2026-04-08 10 篇 · 精读 4
生成式推荐工业落地与序列推荐评测反思
本期日报覆盖 2026-04-07 ArXiv 提交,共 10 篇推荐相关论文(4 篇精读 + 6 篇摘要归档)。两篇高分工业论文聚焦生成式推荐落地:阿里 STAMP 提出双端语义稀疏化(输入 SAP + 输出 MAP)解决 SID-GR 的 Semantic Dilution 问题,1.23-1.38× 提速 + 17-55% 显存节省;美团 NSGR 用基于树的 next-scale 生成式重...
generative-retrievalsequential-recsemantic-idindustrialdiffusion
📅 2026-04-07 4 篇 · 精读 3
生成式推荐的去偏、加速与检索增强
本期日报覆盖 2026-04-06 ArXiv 提交,共 4 篇推荐相关论文(3 篇精读 + 1 篇摘要归档)。三篇核心论文聚焦生成式推荐范式的关键瓶颈与对话推荐的检索增强。CRAB 从语义 token 化的角度剖析生成式推荐中的流行度偏差,指出不均衡的 codebook 会继承并放大历史交互的偏差,提出通过拆分过热 token 并引入树结构正则化保持语义一致性,是一项后处理去偏方案。FAVE 直...
generative-retrievalsemantic-iddiffusionrl
📅 2026-04-06 14 篇 · 精读 4
Semantic ID 与生成式推荐工业实践
本期日报覆盖 2026-04-03 至 04-05 三天 ArXiv 提交,共 14 篇推荐相关论文(4 篇精读 + 10 篇摘要归档)。主线聚焦在生成式推荐与 Semantic ID 的工业落地:腾讯发布 Tencent Advertising Algorithm Challenge 2025(TencentGR-1M/10M)—— 首个公开的全模态工业级生成式推荐数据集,包含真实广告日志的协同...
generative-retrievalsemantic-idindustrialad-recmulti-business