Paper Reading — Archivist

今日收录 2 篇推荐系统论文,生成式推荐与判别式(序列)推荐各一,恰好对应一工业、一学术两条线。重点是快手的 RaG(Recommendation-as-Generation):它提出“解耦语义 ID”(D-SIDs,把内容与创意分离),让生成式推荐模型(GRM)预测的兴趣 ID 不再用于检索固定库存,而是经多智能体视频生成(VGAs)与跨域奖励学习 GDPO 解码为全新个性化视频,在 4 亿日活...

semantic-idindustrialad-recrl

📅 2026-06-24 4 篇 · 精读 0

Scaling law 透视:LLM 蒸馏、可塑性与基础模型再评测

本日共收录 4 篇论文,3 篇属 LLM、1 篇为图学习,全部来自学术界,主线围绕“规模化”展开。Scaling Laws for Task-Specific LLM Distillation 推导面向特定领域的压缩经验 scaling law,量化迭代结构化剪枝下领域内/通用性能随数据量与压缩比的变化,并提出 blended CoT 监督损失稳定 KL 蒸馏、恢复剪枝抹去的通用知识,附带发布量化...

parameter-scalingknowledge-distillationsearch-rankingacademic

📅 2026-06-23 8 篇 · 精读 0

推荐扩展的代价与 LLM 驱动的评估新范式

当日共 8 篇,全部出自学术界、无工业参与且均为简评未精读;类别上判别式推荐 3 篇、LLM 2 篇、其他 2 篇(对话推荐评估与轨迹推荐)、生成式推荐 1 篇。重点之中,SPRINT 揭示 Transformer 序列推荐扩参时精度上升却同时放大流行度偏置,根因是注意力聚合与 FFN 投影协同引发的预测“谱坍缩”,通过约束注意力得分矩阵的最大列和与 FFN 谱范数,在 0.05M–0.34B 规...

parameter-scalingpretrained-lmtransformeracademic

📅 2026-06-19 3 篇 · 精读 1

大模型表征的结构化与冗余精简

当日共 3 篇,1 篇精读、2 篇速读;类别上生成式推荐 1 篇、LLM 2 篇,工业界仅 Meta 1 篇,其余为学术。重点是 G2Rec(Meta):消去 user 节点构造稀疏 item 共参与图,谱稀疏化把边压到 O(M log M),在图上做可微软模块度聚类得到每个 item 的兴趣原型软成员,再把连续兴趣画像 token 与 item 嵌入交替成序列喂 Llama2-13B 自回归推荐...

semantic-idknowledge-distillationtransformerindustrialpretrained-lm

📅 2026-06-18 3 篇 · 精读 2

冷启动推荐双线攻坚:隐式反馈去噪与多模态召回

当日共收录 3 篇推荐系统论文,其中 2 篇精读、1 篇略读;按类别分为生成式推荐 1 篇与判别式推荐 2 篇,工业界(快手、Zalando)占两篇、学术界一篇。DIF(快手)提出模型无关的冷启动隐式反馈去噪框架,用内容相似暖物品的协同表征生成置信度加权伪标签,再以相对熵与冷启动状态估计样本不确定性自适应修正噪声标签,十亿级线上部署显著提升冷启动商业指标。VCG(Zalando)是一套 zero-...

cold-startindustrialcontrastive-sslpretrained-lm

📅 2026-06-17 6 篇 · 精读 0

检索与推荐的重新形式化:联合解码、闭环茧房与曝光设计

本日共 6 篇,以检索与推荐为主(other 4、生成式推荐 1、LLM 1),整体偏学术,仅一篇含真实工业平台田野实验。NNN(2606.17910)把稠密检索重构为联合解码,用非负弹性网让文档 embedding 稀疏非负地共同重建 query,显式建模语料相关性与冗余,理论证明严格优于内积检索并带端到端训练增益。RecLoop(2606.17707)用 LLM 用户模拟器搭闭环,对比生成式推...

search-rankingsemantic-idpretrained-lmindustrial

📅 2026-06-16 12 篇 · 精读 5

工业级 Transformer 原生推荐架构与生成式范式双线推进

本日共收录 12 篇论文,以判别式推荐为主(8 篇),生成式推荐(3 篇)与 LLM(2 篇)为辅,工业界参与度高(Shopee、快手、腾讯、网易云音乐)。OneRank(Shopee)把多任务推理内化进 Transformer 栈,以任务 token 互不可见、候选感知上下文化与带梯度解耦的跨任务注意力消除编码器-预测器分离,线上 GMV/UU +1.01%;OneBar(快手)用单个 BART...

transformerindustrialsearch-rankingpretrained-lm

📅 2026-06-15 5 篇 · 精读 2

Semantic ID 生成式推荐:隐式推理与显式时序注入

本日共收录 5 篇推荐系统论文(2 篇精读),生成式推荐 2 篇、判别式推荐 1 篇、其他 2 篇,工业界(Snap、Meta)与学术研究并存。Snap 的 PauseRec 诊断出显式 CoT 在 SID 生成式推荐中失败的三大根因(世界知识难言语化、文本-SID 嵌入错位、rationale 脆弱),改用可训练 token 做隐式 latent 推理替代显式 rationale...

semantic-idpretrained-lmquantizationindustrial

📅 2026-06-12 5 篇 · 精读 1

LLM 与生成式推荐:工业可编辑检索与内容污染鲁棒性

当日共 5 篇,类别分布为生成式推荐 1 篇、LLM 相关 3 篇、判别式推荐 1 篇,仅 1 篇出自工业界(快手)其余均为学术,1 篇精读。重点为快手 OneRetrieval:首个"可编辑"生成式电商检索,用 Keyword-Aligned Encoding 把每个 SID 位置绑定到可解释属性词并预留空槽,运营无需重训即可注入新词,深召回与最强生成式基线 OneSearch 打平、干预命中率...

semantic-idpretrained-lmindustrialsearch-ranking

📅 2026-06-11 5 篇 · 精读 1

LLM 推荐检索工业落地:蒸馏与压缩的降本提效

今日 5 篇论文(生成式推荐 1、LLM 1、其他 3),工业与学术大致各半,仅 1 篇精读。主线是大模型如何被蒸馏与压缩塞进工业推荐/检索的实时服务链路。Google 的 LLM-Based User Personas 在十亿级视频平台实时生成自然语言用户兴趣画像(总结兴趣+探索兴趣),把 Gemini Pro 蒸馏到 Nano 并经异步生成与量化压上线,线上观看时长 +0.04%、活跃用户 +...

pretrained-lmknowledge-distillationquantizationindustrial

📅 2026-06-10 5 篇 · 精读 1

LLM 语义驱动推荐与 2-bit 极致量化双线推进

当日共 5 篇:推荐系统 3 篇(生成式 2、判别式 1)、LLM 量化 2 篇;工业界仅快手 1 篇,其余 4 篇为学术,精读 1 篇。重点上,快手 AIR 把基于 LLM 的跨域意图推理离线化为“原子行为-意图对”缓存,在线仅做意图树检索、目标感知检索与 MHA 融合,以约 400 倍吞吐换取实时 LLM 语义,电商场景取得 +3.446% GMV,是当日唯一工业落地。GenAIR 用 LLM...

pretrained-lmsemantic-idquantizationindustrial

📅 2026-06-09 15 篇 · 精读 6

工业级生成式推荐的强化偏好对齐与判别式 CTR 扩展双线

本日 15 篇、6 篇精读;生成式推荐 6、判别式推荐 3、LLM 与其他各 3,工业界(JD、Netflix、Yandex、OPPO、Meta)主导。JD 的 AdaGRPO 把生成式推荐 RL 对齐从“均匀施奖”改为“选择性准入”,用 sample-level clip 只在策略不确定且奖励可信处放行梯度,离线 HR@10 11.01%→12.18%、线上 effective IPV +0.4...

industrialrlsemantic-idparameter-scaling

📅 2026-06-08 7 篇 · 精读 2

Semantic ID 驱动的生成式与判别式推荐工业落地

今日共收录 7 篇推荐相关论文（生成式检索 4、判别式 1、其他 2），其中 2 篇精读、5 篇略读，工业界由阿里淘宝、Yandex 领衔。SSRLive（阿里）提出生成式-判别式混合的直播粗排，为每个直播间生成刻画主播稳定属性的静态 Semantic ID，与追踪实时人气的动态 SID（实时特征经 RQ-KMeans+EMA 在线码本量化），全量服务数亿用户，线上观看时长 +3.38%、GMV ...

semantic-idindustrialquantizationtransformercold-start

📅 2026-06-05 4 篇 · 精读 2

工业生成式推荐迈向强化推理，冷启动与去噪并进

本日共收录 4 篇推荐系统论文，生成式与判别式各 2 篇，其中 2 篇工业论文获深度精读、2 篇学术论文仅略读。重点上，快手 OneRec 团队的 OneReason 以四粒度感知预训练、三层认知 CoT（人格抽象→兴趣扩展→转移推理）的 SFT 及"专精后统一"的 RL 配方（域内 GRPO→RFT/MOPD），首次让生成式推荐的"思考模式"稳定超越非思考模式，并已在快手本地生活广告线上部署、R...

rlsemantic-idcold-startindustrialpretrained-lm

📅 2026-06-04 11 篇 · 精读 3

大模型语义表征与行为基础模型 scaling 重塑工业推荐

今日共收录 11 篇,类别分布为生成式推荐 2、判别式推荐 3、LLM 4、其他 2,其中 2 篇工业论文经过精读,整体呈工业重磅与学术探索并行之势。快手 RGCD-Rep 把冻结大教师 MLLM 的结构化跨域推理蒸馏进轻量学生模型,经“可迁移残差”查询感知聚合与行为/语义双信号路由,学出可离线落库的短视频→直播跨域表征,已全量服务 4 亿+日活;阿里 DSIRM 把语义 ID 从生成式检索目标重...

pretrained-lmsemantic-idparameter-scalingindustrial

📅 2026-06-03 7 篇 · 精读 2

推荐与 LLM 建模的效率帕累托权衡

当日共收录 7 篇,涵盖生成式推荐 1、判别式推荐 3、LLM 2 及其他 1,其中 2 篇精读,工业界(快手、ShareChat)与学术界大致各半。Taiji(快手)是工业级 LLM-as-Enhancer 框架,用逆向工程 CoT 与 PPL 拒绝采样提升推理数据质量,再以 POPO 在 GRPO 中对语义奖励与 CTCVR 协同奖励做帕累托最优加权,7B 模型离线超越 32B 教师,线上取得...

industrialpretrained-lmtransformerrlad-rec

📅 2026-06-02 15 篇 · 精读 4

工业级推荐落地：Semantic ID 量化与生成式建模双线突破

今日共 15 篇，判别式推荐 6 篇、LLM 7 篇、生成式推荐 2 篇，4 篇精读全部出自工业界。快手 FlowTime 提出“连续生成式回归”新范式，以一步式 VAE 加基于观看时长分位数历史的条件 Normalizing Flow 把高斯先验 warp 成个性化多峰分布，避免点回归均值坍缩与离散化误差，线上视频播放时长 +1.044% 并开源 TimeRec 基准。LinkedIn 的 RQ...

semantic-idquantizationindustrialcold-start

📅 2026-06-01 9 篇 · 精读 3

工业级推荐：统一检索排序架构与 Semantic ID 编码

当日共收录 9 篇，精读 3 篇；类别上以判别式推荐（5）为主，生成式推荐（2）、LLM（2）与其他（1）并存，工业界 3 篇（Pinterest×2、Meta）、学术界 6 篇。重点首推 Pinterest 的 UniPinRec——首个全栈统一检索与排序的生产系统，以单输入格式、单共享骨干、单阶段联训，借 Masked Action Modeling 与跨进程 KV-cache 共享，实现线上...

industrialsemantic-idsearch-rankingquantization

📅 2026-05-29 4 篇 · 精读 2

工业推荐与搜索排序的参数缩放及高效落地

当日共 4 篇论文，判别式推荐与 LLM 推荐各 2 篇；工业界（ByteDance、Coupang）2 篇均经精读，学术 2 篇仅略读。重点上，ByteDance 的 Rec-Distill 把蒸馏收益分解为“教师 scaling 收益 × 可迁移性 η”，以解耦双塔学生、黑盒 CE 蒸馏、学生侧去偏与批流混合流水线，将 24B 参数 / 20K 序列教师的缩放收益迁移给轻量部署学生，峰值可迁移...

parameter-scalingindustrialknowledge-distillationsearch-ranking

📅 2026-05-28 6 篇 · 精读 2

LLM 与世界模型驱动推荐：工业落地与偏好对齐

本日共 6 篇，类别为 LLM 推荐 3 篇、判别式 2 篇、生成式 1 篇，工业界 2 篇、学术界 4 篇，其中精读 2 篇。Pinterest 的工作把微调开源 LLM 当作“广告主预测器”而非排序器，从用户画像与转化历史预测高意图广告主并同时注入召回与排序，线上美区 Shopping RoAS 提升 4.94%/6.69%。LUCID 部署的 AMRS 用因果 Transformer 世界模...

pretrained-lmrlindustrialmoe

📅 2026-05-27 5 篇 · 精读 2

端侧 MoE 推理提效与工业级推荐流量治理

本日共 5 篇论文,类别分布为 llm、判别式推荐各 1 篇与 other 3 篇;工业界(Meta、Alibaba)2 篇、学术 3 篇,其中 2 篇完成精读。重点上,Meta 的 MobileMoE 提出首个 sub-billion 激活的端侧 MoE 模型族,基于联合内存+算力约束的端侧扩展律确立“适中稀疏+细粒度+共享专家”甜点架构,经四阶段配方与 INT4 QAT,在 14 个 benc...

moeparameter-scalingindustrialsearch-ranking

📅 2026-05-26 15 篇 · 精读 6

工业推荐系统:测试时扩展、生成式重排与效率优化

今日 15 篇,精读 6 篇;判别式推荐 8、生成式推荐 2、LLM 3、其他 2,工业界(阿里/腾讯/蚂蚁/Taboola)为精读主力。阿里 UTTSI 是首个免训练、模型无关的测试时计算扩展框架,按实例不确定性分配特征探索路径,线上 +5.3% CTR;阿里 DeGRe 用前瞻评估器离线挖掘高价值排列并混合蒸馏稠密监督,单次贪心解码逼近全局最优,淘宝闪购 GMV +3.75%;腾讯 SIREN...

industrialfeature-interactionsemantic-idad-rectest-time-training

📅 2026-05-25 8 篇 · 精读 3

工业推荐的规模化扩展与长尾冷启动

今日共 8 篇:判别式推荐 4、生成式推荐 1、LLM 2、其他 1;3 篇精读全为工业界(阿里/Netflix/腾讯),5 篇略读偏学术。Netflix 把生成式推荐骨干从 2M 扩到 1B,提出任务相关 offset 幂律 scaling law 作“还有多少剩余空间”的诊断,并配采样 softmax、d/8 解码头、多 token 预测与语义物品塔把规模红利传导到下游,1B 全面胜出、冷启动...

parameter-scalingindustrialcold-startsemantic-id

📅 2026-05-22 5 篇 · 精读 2

LLM 显式推理与生成式检索重塑推荐召回

本日 5 篇均围绕推荐/检索召回，3 篇生成式、2 篇判别式，2 篇精读，工业界（快手、Meta）与学术界各半。快手 RPORec 用文本接口解耦“生成显式 CoT 的 LLM backbone”与轻量检索头 Rechead，两阶段交替训练，以冻结 Rechead 作稠密可验证奖励并用 GRPO 精炼推理，规避隐状态扭曲与文本→item 语义鸿沟，工业广告 A/B 营收 +1.348%。Meta ...

pretrained-lmrlsemantic-idad-recindustrial

📅 2026-05-21 6 篇 · 精读 2

工业直播推荐新范式与 LLM 训练标度律

本日共 6 篇：判别式推荐 3 篇、LLM 训练 2 篇、其他 1 篇，工业与学术约各半，其中 2 篇完成精读。工业直播线两篇最亮眼：字节跳动的 PEARL 把直播 watch-time 预测重构为非参数的每用户分位数估计，证明"当前样本是否大于一个随机历史样本"的对比指示其期望即为无偏 CDF，十亿级上线带来 +2.10% 观看时长并显著改善低活用户；FLUID 首次在生产级直播排序中彻底弃用候...

industrialsemantic-idcontrastive-sslparameter-scaling

📅 2026-05-20 4 篇 · 精读 1

向量量化双线推进，推荐与推理理论同台

本日共 4 篇论文，1 篇精读 3 篇略读；类别分布为 LLM 2 篇、判别式推荐 1 篇、其他 1 篇，全部来自学术机构。重点是首尔国立大学的 BlockQuant（2605.19972），把 rotation-based 向量量化的码本从 coordinate-wise scalar 推广到 block-on-sphere，按球面均匀分布解析推导块边缘分布并做 K-means，在 MSE 与内...

quantizationpretrained-lmcontrastive-sslacademic

📅 2026-05-19 12 篇 · 精读 6

生成式推荐多维突破：冷启动、长尾去偏与可变长 SID

本日共 12 篇论文，其中 6 篇精读、6 篇浅读；类别分布以生成式推荐为主（6 篇），判别式推荐 2 篇、LLM 3 篇、其他 1 篇，工业（Alibaba/Kuaishou/Huawei）与学术机构并举。重点工作中，阿里 Taobao 的 GrowthGR 首次把可持续新品增长拆为 ItemLTV 反事实 uplift 与 MultiGR/MoPO 多价值 GRPO 变体，线上 2 个月获得新...

semantic-idrlindustrialcold-startquantization

📅 2026-05-15 6 篇 · 精读 3

Semantic ID 驱动的生成式推荐工业化与排序-召回统一

本日共收录 6 篇论文，其中生成式推荐 3 篇、判别式排序 1 篇、LLM 推荐 2 篇、其他 1 篇，工业界出品占据全部 3 篇精读重点。美团 DIG 把 RQ tokenizer 嵌入 DIN+DCNv2+MoE 判别式排序器内部，用 BCE loss 端到端驱动 SID codebook 构造，配合特征分配 taxonomy 与 MLP_u2t 蒸馏让同一模型既排序又通过 beam sear...

semantic-idquantizationindustrialsearch-rankingrl

📅 2026-05-13 11 篇 · 精读 3

生成式推荐多路径演进与工业级表格预训练并举

今日共收录 11 篇论文，3 篇完成精读，覆盖生成式推荐（3）、判别式推荐（3）、LLM 推荐（3）及通用方向（5），工业与学术成果并存。重点工作 MaskTab（蚂蚁集团 MyBank × 浙大）以专用 [MASK]/[MISS] token 把"缺失即信号"编码进统一表格预训练框架，孪生双路监督消除 train-test mismatch，MoE 重建头自适应扩容高维特征交互，TabReD 8...

semantic-idpretrained-lmindustrialparameter-scalingrl

📅 2026-05-12 10 篇 · 精读 6

工业级推荐系统全栈突破与 LLM 缩放/几何理论双线深化

本日共 10 篇论文，6 篇精读 4 篇略读，覆盖 LLM（3 篇）、判别式/生成式推荐（4 篇）与系统/检索（3 篇），工业与学术约各半。Arena Physica 的 "Practical Scaling Laws" 提出 8 参数闭合形式 L(N,D,T)，将 loss 分解为 undercapacity/undertraining/overfitting 并在 5 个公开 LLM grid...

semantic-idindustrialparameter-scalingpretrained-lmrecursive-depth

📅 2026-05-11 5 篇 · 精读 2

生成式推荐基准审计与对话式语义ID落地

本日共 5 篇论文，2 篇精读、3 篇略读；类别分布上生成式推荐 2 篇、判别式推荐 1 篇、LLM 推荐 1 篇、其他 1 篇，工业界（腾讯、Airbnb）与学术界各半。重点论文方面，腾讯 NewsRec-Chat 提出 Generate-then-Match 范式，让 7B LLM 直接生成 3 层分层 Semantic ID 前缀，对 24h 滚动新闻池做模糊匹配，从架构上保证 0% 幻觉，...

semantic-idpretrained-lmcold-startindustrialacademic

📅 2026-05-08 6 篇 · 精读 2

生成式推荐表达力与价值对齐双线突破

本日共收录 6 篇论文，涵盖生成式推荐 2 篇、判别式推荐 2 篇、LLM 与检索各 1 篇，工业与学术贡献各占一半。重点工作集中在生成式推荐（GR）方向：UCSD 与 Snap 联合提出的 Latte（2605.06331）从理论上揭示了自回归 Semantic ID 解码受 tree-distance 概率耦合约束、无法表达 rank-reversal 与 forced-transitivit...

semantic-idtransformerrlindustrialacademic

📅 2026-05-07 6 篇 · 精读 5

生成式推荐与服务系统全栈优化：Semantic ID、对齐与 HBM 调度协同推进

今日共 6 篇论文，5 篇精读、1 篇略读；类别上 generative-rec 占 3 篇，llm、other、discriminative-rec 各 1 篇，工业系（Alibaba 主导）与学术系基本对半。建模侧：CapsID 用 capsule 软路由替代 RQ-VAE 的硬 argmax 并配合置信驱动变长 SID 与 SemanticBPE 双门控合并，在 35M item 工业目录上...

semantic-idindustrialpretrained-lmmoequantization

📅 2026-05-06 2 篇 · 精读 0

AI 生成音乐流行度预测与 Agentic 工作流编排

本日共 2 篇论文均为学术界产出，类别分布偏向其他方向，无工业界深度精读论文。APEX(新加坡科技设计大学)基于冻结的 MERT 自监督音乐表征，在 21 万首 Suno/Udio 生成音乐上构建多任务框架,联合预测流行度信号与五维美学质量,并在 Music Arena 偏好预测上验证了美学特征对 OOD 泛化的增益。From Intent to Execution 提出一个自动化多智能体编排框架...

pretrained-lmsearch-rankingacademic

📅 2026-05-05 9 篇 · 精读 5

Scaling Laws 三连发与领域 Foundation Model 实践

本日共 9 篇论文，3 篇 LLM、3 篇判别式推荐、3 篇 other，工业（ByteDance/Meta/Tencent）与学术（Cornell/Yale/清华）各占半壁，主线集中在 Scaling Law 的精细化与跨域 Foundation Model 实践。三大 Scaling Law 工作中，ByteDance 的 InfoLaw 把训练重写为信息累积过程，用 quality dens...

parameter-scalingtransformerindustrialacademic

📅 2026-05-04 3 篇 · 精读 0

推荐系统负样本挖掘与多模态鲁棒性

本日共 3 篇推荐系统论文，2 篇判别式 + 1 篇生成式,工业与学术各占其一。DynamicPO 针对 LLM 推荐 DPO 训练中"偏好优化坍塌"现象,理论归因于 easy negatives 主导梯度,提出动态选择决策边界附近信息性负样本并按边界模糊度自适应 beta 系数,在三个公开数据集上稳定提升。IKEA.com 的稠密检索工业实践利用商品分类层级和属性构造结构化 hard negat...

contrastive-sslpretrained-lmsearch-rankingindustrialacademic

📅 2026-05-01 2 篇 · 精读 1

LLM 生成式推荐的推理加速与列表重排

今日共 2 篇论文，均聚焦 LLM 推荐方向，分布于 generative-rec 与 llm 两类，全部来自学术机构。重点论文 PAD-Rec（中科大等）针对 SID 列表式生成推荐的推理瓶颈，在 speculative decoding 草稿模型中注入 within-item slot 与 draft-step 两类位置嵌入并以轻量门控融合，使草稿端结构感知化，在四个公开数据集上获得最高 3....

pretrained-lmtransformersemantic-idsearch-rankingacademic

📅 2026-04-30 8 篇 · 精读 3

生成式与 LLM 推荐：语义 ID、压缩重排与因子化潜推理

今日共 8 篇论文，3 篇精读、5 篇略读；类别分布为判别式推荐 4 篇、生成式推荐 2 篇、LLM 检索/重排 1 篇、隐私 1 篇，整体以学术为主。重点精读三篇均围绕"生成式 / LLM 范式下的表征与推理瓶颈"展开：CARD（电子科大）把文本、视觉与协同信号渲染为统一卡牌图像，由 SigLIP2 编码后引入可学习可逆的非均匀变换（Kumaraswamy CDF / scaled logist...

semantic-idquantizationpretrained-lmrlacademic

📅 2026-04-28 16 篇 · 精读 6

Semantic ID 工业落地与长序列 KV 压缩双线推进

本日共 16 篇，6 篇精读、10 篇仅简评；按类别分布生成式推荐 4 篇、判别式推荐 3 篇、LLM 3 篇、其他 6 篇，工业-学术比约 4:12，快手、美团、苹果三家工业方贡献了最重的几篇。重点论文上，快手 KSA（2604.24432，reading_score 9）通过插入可学习 summary token 实现 O(n/k) 语义级 KV 压缩，与 GQA/MLA 完全正交可叠加 8×...

semantic-idindustrialtransformersparse-attentionparameter-scaling

📅 2026-04-27 7 篇 · 精读 3

RL 重塑 LLM 生成式推荐与检索重排

本日共 7 篇论文，3 篇精读、4 篇略读；类别分布以生成式推荐（3）与 LLM 检索（2）为主，工业（华为、阿里）与学术（USTC×Meta 等）双线并进。重点论文中，华为 ReCast 把生成式推荐 RL 的瓶颈从"奖励稀疏"前推至"group 可学性退化"，用 ground-truth anchor 修复 all-zero 组并以 hardest 正负对边界对比替代全组归一化；阿里 Qwen...

rlpretrained-lmsearch-rankingindustrialacademic

📅 2026-04-24 1 篇 · 精读 0

LLM 离线知识蒸馏赋能传统序列推荐

今日仅 1 篇相关 ArXiv 提交，属学术界工作，同时归入"LLM"与"判别式推荐"两类。重点论文为 Severin 等人提出的 LLM-蒸馏序列推荐框架（arxiv 2604.21536）：利用预训练 LLM 在离线阶段为用户生成文本化画像，作为额外监督信号蒸馏进传统序列推荐模型，在线服务时完全无需 LLM 推理，也不改动既有模型架构,从而在保留传统模型低延迟优势的同时引入 LLM 的语义理解...

sequential-recknowledge-distillationllm-basedacademic

📅 2026-04-23 2 篇 · 精读 0

LLM 自博弈扩展与 Agent 记忆结构化生成

本日共 2 篇 LLM 方向学术论文，均未精读，聚焦 LLM 训练扩展与 Agent 基础设施两个子方向。Scaling Self-Play with Self-Guidance（SGS，Stanford，Hashimoto/Tengyu Ma 组）在传统 Conjecturer/Solver 双角色自博弈之外引入第三方 Guide 角色，对合成问题的相关性与自然度打分以抑制 Conjecture...

llm-basedrlscalingacademic

📅 2026-04-22 7 篇 · 精读 3

工业级推荐系统的结构创新与 scaling 新维度

今日共纳入 7 篇论文，4 篇判别式推荐 + 3 篇 LLM 相关，工业-学术比约 4:3，其中 3 篇完成精读且评分均达 8 分。Alibaba 的 LoopCTR 把共享层递归复用提升为正交于深度/宽度/输入的第四种 scaling 维度，配合 Hyper-Connected Residuals、MoE 与多深度 process supervision，实现 train-multi-loop ...

ctr-predictionsequential-recscalingsemantic-idindustrial

📅 2026-04-21 12 篇 · 精读 3

工业排序表征质量提升与生成式推荐理论基础双线并进

2026-04-21 共收录 12 篇论文，判别式推荐 6 篇、LLM 方向 3 篇、其他 2 篇、生成式推荐 1 篇；精读论文 3 篇均来自国内大厂，工业落地色彩浓厚。重点论文方面，腾讯 RankUp（2604.17878）从「有效秩」视角系统解决 MetaFormer 排序器的表征坍缩问题，提出随机置换分片、多嵌入表、全局 token 等五项机制，在微信三大广告场景实现 3.41–4.81...

ctr-predictionfeature-interactionscalingindustrialgenerative-retrieval

📅 2026-04-17 1 篇 · 精读 1

工业级生成式推荐：训练信号、序列压缩与强化对齐

2026年4月17日共收录1篇论文，类别集中于生成式推荐（generative-rec），来自工业界。重点论文 GenRec（京东）系统性回应了大规模生成式检索在工业部署中的三大核心瓶颈：（1）训练信号稀疏——提出页粒度 NTP（Page-wise Next-Token Prediction），将有效训练信号密度显著提升；（2）语义ID序列过长——设计非对称 Token Merger，以约2倍...

generative-retrievalsemantic-idrlsequential-recindustrial

📅 2026-04-16 8 篇 · 精读 2

序列推荐统一建模与时序特征工程的多路并进

2026-04-16 共收录 8 篇推荐系统论文，判别式推荐占主导（6 篇），生成式检索与 LLM 推荐各 1 篇；工业级论文 3 篇，学术论文 5 篇。本日最受关注的是腾讯提出的 TokenFormer（精读分 8），其核心贡献在于通过 BFTS（Bottom-Full-Top-Sliding）分层注意力与 NLIR 非线性门控机制，将多域特征交叉与序列行为建模统一到单一 Transform...

sequential-rectransformerfeature-interactionattention-mechanismindustrialacademic

📅 2026-04-13 5 篇 · 精读 1

工业级用户行为序列建模与学术推荐表示优化并行推进

今日共收录 5 篇论文，涵盖判别式推荐（4 篇）与 LLM/MoE 理论（1 篇），工业落地论文 1 篇，学术探索论文 4 篇。重点论文为字节跳动的 **IAT**（Instance-As-Token），该工作将用户历史交互的全量特征压缩为紧凑实例 token，以两阶段解耦框架（Source Instance Transformer 压缩 + 标准序列模型建模）突破传统手工特征序列的信息瓶颈。...

sequential-recctr-predictionfeature-interactionindustrialscaling

📅 2026-04-10 7 篇 · 精读 3

工业级生成式与判别式推荐双线突破：可扩展稀疏 + 稳定嵌入

本期日报覆盖 2026-04-09 ArXiv 提交，共 7 篇推荐相关论文（3 篇精读 + 4 篇摘要归档），类别均衡分布在生成式、判别式、LLM 三大范式。三篇重点论文均来自工业 / 学术深度结合：Alibaba (AliExpress) 的 SSR 框架以显式稀疏取代 Wukong/RankMixer 的密集架构，在亿级 CTR 数据上实现真正的 scaling law，连续超越 RankM...

industrialscalingfeature-interactionrlllm-based

📅 2026-04-09 2 篇 · 精读 0

冷启动与 persona 建模成为今日推荐议题主线

今日 7 篇候选均未达到精读门槛（>=7）。两篇进入摘要归档：ACARec 用 artist catalog attention 解决音乐冷启动，将问题重构为 semi-cold 范式，相比纯内容基线 Recall/NDCG 翻倍，方法清晰但偏应用向；persona-driven SBRS 把 LLM 物品嵌入与异构 KG 融合，通过 HDGI 学习匿名 session 的 latent pers...

cold-startsequential-recllm-based

📅 2026-04-08 10 篇 · 精读 4

生成式推荐工业落地与序列推荐评测反思

本期日报覆盖 2026-04-07 ArXiv 提交，共 10 篇推荐相关论文（4 篇精读 + 6 篇摘要归档）。两篇高分工业论文聚焦生成式推荐落地：阿里 STAMP 提出双端语义稀疏化（输入 SAP + 输出 MAP）解决 SID-GR 的 Semantic Dilution 问题，1.23-1.38× 提速 + 17-55% 显存节省；美团 NSGR 用基于树的 next-scale 生成式重...

generative-retrievalsequential-recsemantic-idindustrialdiffusion

📅 2026-04-07 4 篇 · 精读 3

生成式推荐的去偏、加速与检索增强

本期日报覆盖 2026-04-06 ArXiv 提交，共 4 篇推荐相关论文（3 篇精读 + 1 篇摘要归档）。三篇核心论文聚焦生成式推荐范式的关键瓶颈与对话推荐的检索增强。CRAB 从语义 token 化的角度剖析生成式推荐中的流行度偏差，指出不均衡的 codebook 会继承并放大历史交互的偏差，提出通过拆分过热 token 并引入树结构正则化保持语义一致性，是一项后处理去偏方案。FAVE 直...

generative-retrievalsemantic-iddiffusionrl

📅 2026-04-06 14 篇 · 精读 4

Semantic ID 与生成式推荐工业实践

本期日报覆盖 2026-04-03 至 04-05 三天 ArXiv 提交，共 14 篇推荐相关论文（4 篇精读 + 10 篇摘要归档）。主线聚焦在生成式推荐与 Semantic ID 的工业落地：腾讯发布 Tencent Advertising Algorithm Challenge 2025（TencentGR-1M/10M）—— 首个公开的全模态工业级生成式推荐数据集，包含真实广告日志的协同...

generative-retrievalsemantic-idindustrialad-recmulti-business

📅 2026-W25 (2026-06-15 ~ 2026-06-21) 24 篇

大模型原生推荐架构横扫判别式与生成式两线,工业落地密集

本周(06-15 至 06-21)共收录 24 篇论文,集中在 06-16 至 06-19 四个工作日;类别上判别式推荐占主导,生成式推荐、LLM 与检索(other)并行,工业界参与度极高,Shopee、快手、腾讯、网易云音乐、Meta、Zalando 等悉数登场。本周呈现三条主线。其一,Transformer/大模型正成为推荐系统的原生底座,同时重塑判别式排序与生成式检索:OneRank(Shopee)把多任务推理内化进 Transformer 栈,消除编码器-预测器分离,线上 GMV/UU +1.01%;OneBar(快手)用单个 BART encoder-decoder 取代多阶段检索...

📅 2026-W24 (2026-06-08 ~ 2026-06-14) 47 篇

生成式推荐偏好对齐与 Transformer 原生架构双线工业落地

本周（2026-W24）共收录 47 篇论文、精读 16 篇，生成式推荐（约 15 篇）与判别式推荐（约 14 篇）平分主导，LLM 相关 11 篇、其他 8 篇；工业界参与度极高，JD、Netflix、Yandex、Meta、快手、Google、Snap、Shopee、腾讯、网易云音乐悉数登场，学术工作多集中于诊断与理论侧。三条主线贯穿全周。其一，偏好对齐（GRPO/DPO/KTO）正成为生成式推荐的训练范式：JD 的 AdaGRPO 把 RL 施奖从“均匀”改为“选择性准入”，仅在策略不确定且奖励可信处放行梯度；Netflix 的 Mult-DPO 把 DPO 从成对推广到 set-wis...

📅 2026-W23 (2026-06-01 ~ 2026-06-07) 59 篇

工业推荐双线推进：Semantic ID 量化检索与生成式强化偏好对齐

本周（2026-06-01 至 06-07）共收录约 59 篇、精读 18 篇，判别式与生成式推荐两大类并重，辅以 LLM 增强与基础研究，工业界论文占据绝对主导，快手、阿里、LinkedIn、JD、Netflix、Yandex、Meta、Shopee、Bilibili、ShareChat 等悉数登场。主线一是 Semantic ID 持续深化：其角色从生成式检索目标扩展为通用离散语义组件，研究焦点转向量化保真、跨域迁移、冷启动与相关性建模。LinkedIn 的 RQ-FSQ 首次实证跨域 viewer Semantic ID，压缩 30–280 倍而 AUC 不降，最冷段 +1.522% A...

📅 2026-W22 (2026-05-25 ~ 2026-05-31) 54 篇

工业推荐全面落地:Semantic ID 量化、参数缩放与生成式建模三线并进

本周(2026-05-25 至 06-02)六份日报共收录 54 篇、精读 19 篇,判别式推荐为主,LLM 与生成式推荐并行;工业界论文占据全部精读名额,呈现压倒性的“产业落地”基调。技术主线可归纳为三条。其一,Semantic ID 与量化成为最热方向:腾讯 SIREN 将多模态信号由晚融合改为 item 级早融合,Pinterest PrefixMem 把 SID 视作需专用编码器的“模态”并令稀有物品准确率相对提升 115%,LinkedIn RQ-FSQ 首证跨域 viewer Semantic ID、最冷启用户段 +1.522% AUC,Shopee DRQ 给出诊断 tokeni...

📅 2026-W21 (2026-05-18 ~ 2026-05-24) 50 篇

工业推荐规模化:参数与测试时双轴扩展,语义 ID 与长尾冷启动

本周（2026-05-18 至 05-24 ISO 周）共收录 50 篇、精读 20 篇；类别以推荐为主（判别式 20、生成式 12），LLM 12 篇、其他 6 篇，精读主力几乎全是工业界（阿里、字节、腾讯、快手、Netflix、Meta、蚂蚁、Taboola），学术工作多见于略读。主线有三：其一是“规模化扩展”从经验调参走向工程化与诊断化——Netflix 把生成式推荐骨干从 2M 扩到 1B，并提出任务相关 offset 幂律 scaling law 作剩余空间诊断，冷启动 +28.1%；腾讯 RankElastor 以有效秩动力学纠正 RankMixer 嵌入坍缩，主张“多扩张少收缩”...

📅 2026-W20 (2026-05-11 ~ 2026-05-17) 39 篇

Semantic ID 生成式推荐工业化全栈推进,LLM 缩放与几何理论并行深化

本周 4 份日报共收录约 39 篇论文、精读 18 篇,类别上生成式推荐占据绝对主线,判别式推荐、LLM 推荐与缩放/几何理论分列其后;工业界(快手、百度、美团、腾讯、阿里、蚂蚁、小红书)与学术机构产出大致各半。三条技术趋势贯穿全周:其一,Semantic ID 量化范式加速工业化,并沿“非对称表示—可变长编码—排序召回统一”分化——腾讯 AsymRec 以连续-离散非对称框架(MSP+MHQ)破解 popularity-bias 与 dimensional-collapse 双瓶颈,NDCG@10 平均 +15.8%;华东师大 VarLenRec 用双曲自适应残差量化将碰撞率从 12.7% ...

📅 2026-W19 (2026-05-04 ~ 2026-05-10) 38 篇

生成式推荐全栈深耕与 Scaling Law 理论双主线深化

本周共收录 38 篇论文（约 20 篇精读），覆盖 LLM/Scaling、生成式推荐、判别式推荐与系统/检索四大块，工业界（ByteDance、Meta、Tencent、Alibaba、Kuaishou、Baidu、小红书、Airbnb）与学术界（Cornell、Yale、UCSD、MSU）贡献基本对半。两条主线贯穿全周。其一是 Scaling Law 从经验拟合迈向“可解释、可指导 recipe”的阶段：ByteDance 的“InfoLaw”把训练重写为信息累积过程，将 mixture×scale×repetition 坍缩到统一幂律，外推 7B 误差仅 0.15%；Arena Phys...

📅 2026-W18 (2026-04-27 ~ 2026-05-03) 38 篇

Scaling Law 精细化与生成式推荐表征/推理双线突破

本周（2026-W18）共收录 38 篇论文，覆盖判别式推荐、生成式推荐、LLM 推荐与 Foundation Model 等方向，工业与学术大致 4:6，工业方涵盖快手、美团、苹果、字节、Meta、腾讯、IKEA 等。主线呈现两条清晰脉络：一是 Scaling Law 由""描述性""走向""规范性""，二是生成式 / LLM 推荐在表征离散化与推理加速两端同时发力。 Scaling Law 三连发是本周亮点：字节 InfoLaw（2605.01640）把训练重写为信息累积过程，用 quality density × log(K) 归一化指数衰减将 mixture×scale×repeti...

📅 2026-W17 (2026-04-20 ~ 2026-04-26) 29 篇

工业排序结构性 scaling 与 RL/LLM 生成式推荐双线并进

本周（2026-W17，4-20 至 4-26）共纳入约 29 篇论文，9 篇完成精读。类别分布上，判别式推荐 13 篇、LLM 方向 11 篇为主，生成式推荐 4 篇、其他 3 篇；工业团队（腾讯、美团、阿里、快手、华为）与学术机构（Stanford、Meta×USTC 等）大致平分秋色。技术趋势可归纳为三条主线。其一，工业排序系统正从堆参数转向"在 serving 约束内挖掘结构性 scaling"：腾讯 RankUp 以"有效秩"视角系统解决 MetaFormer 表征坍缩，配合随机置换分片与多嵌入表，在微信广告三大场景实现 3.41–4.81% GMV 增益；美团 SIF 把序列粒...

📅 2026-W16 (2026-04-13 ~ 2026-04-19) 9 篇

生成式推荐工业落地与序列建模统一框架的双轨并进

2026-W16（4月13日—19日）共收录 9 篇推荐系统论文，判别式推荐占主导（6 篇），生成式推荐 2 篇，LLM 推荐 1 篇；工业级论文 4 篇，学术论文 5 篇。本周论文量虽不大，但工业落地深度与技术主线集中度均较高，形成两条清晰的主轴。 **主轴一：生成式推荐的工业系统化**。本周最具代表性的工业成果是京东的 GenRec，系统性回应了大规模生成式检索在工业部署中的三大瓶颈：训练信号稀疏（页粒度 NTP 监督）、语义 ID 序列过长（非对称 Token Merger，约 2× 压缩比）、生成结果与用户偏好不对齐（GRPO-SR，以点击率和成交率为混合奖励的强化学习对齐）。30 ...

📅 2026-W15 (2026-04-06 ~ 2026-04-12) 28 篇

生成式推荐工业化落地与序列建模规模化双线并进

2026-W15 共收录推荐系统相关论文 28 篇（含精读 11 篇、摘要归档 17 篇），工业界论文占比显著偏高，来源覆盖阿里巴巴、美团、Zalando、字节跳动等头部公司，是近期工业落地密度最高的一周。 **核心趋势一：生成式推荐进入工业规模部署期。** 两篇高影响力工业论文集中体现这一转折：阿里 STAMP 以双端语义稀疏化（输入 SAP + 输出 MAP）解决 SID-GR 的 Semantic Dilution 瓶颈，实现 1.23-1.38× 提速与 17-55% 显存节省；美团 NSGR 则以树形 next-scale 生成式重排将候选集复杂度压至 log₂(m)，美团外卖 8...

📅 2026-05 147 篇

推荐系统全面工业化:Semantic ID、多维 Scaling 与生成式建模三线并进

本月共收录 147 篇论文、精读 59 篇;类别上判别式推荐(52)居首,LLM(41)、生成式推荐(32)与其他(29)并行,而精读名额几乎被工业界包揽,学术工作多见于略读——"产业落地"构成本月压倒性基调。主线一:Semantic ID 量化范式全面工业化,并沿多条路径分化。腾讯 AsymRec 以连续-离散非对称框架破解 popularity-bias 与 dimensional-collapse,NDCG@10 平均 +15.8%;美团 DIG 把 RQ tokenizer 嵌入判别式排序器实现同模型 "排序+检索",R@10 增益 +52%~+220%;阿里 CQ-SID 用类目约束簇式 SID 单链路贡献全平台 72.63% 购买;华东师大 VarLenRec 以双曲自适应残差量化把碰撞率从 12.7% 降至 3.2%;Pinterest PrefixMem 把 SID 视...

📅 2026-04 106 篇

生成式推荐工业化与判别式排序结构性 scaling 双线突破

## 本月概览 2026 年 4 月共纳入推荐系统相关 ArXiv 论文 106 篇，其中精读 37 篇（精读率约 35%）。类别分布上，判别式推荐 41 篇（39%）位居首位，LLM 推荐 28 篇（26%）、生成式推荐 23 篇（22%）、其他 16 篇（13%）。从来源看，工业界论文占比明显高于历史均值，腾讯、美团、阿里、字节、快手、京东、华为、苹果、Snapchat、Zalando 等头部公司密集贡献了带线上 A/B 验证的系统级工作，是近年工业落地密度最高的一个月。 ## 最热研究方向 **方向一：生成式推荐进入工业系统化部署期。** 这是本月最显著的转折。阿里 STAMP 用双端语义稀疏化（输入 SAP + 输出 MAP）解决 SID-GR 的 Semantic Dilution，1.23–1.38× 提速 + 17–55% 显存节省；美团 NSGR 以树形 next-s...