Paper Morning 2026-06-05
2026-06-05
各位早上好,又到了周五,Paper Morning开播的日子了。
今天想先从一个我们日常科研中都会遇到的现象聊起。你有没有发现,当我们在评估一个新模型的时候,往往喜欢看一个汇总的榜单,一个数字从上往下排。但今天第一篇论文就告诉我们,这个做法可能正在掩盖一些重要的信息。
这篇论文叫《后GCN时代的重新审视:基于曲率的分层评估》。作者指出,现在 relational learning 的评估总是用一张flat leaderboard,把性能 Across 不同的数据集做一个平均。但这背后其实隐含了一个假设,认为所有数据有着统一的结构。作者告诉我们,这个假设是有问题的。他们发现,数据的内在几何性质其实是决定模型效果的一个关键隐变量。传统的聚合指标会掩盖掉很多性能权衡,这些权衡只有在按几何属性对数据集进行分层之后才能显现出来。所以他们提出了一个基于曲率的评估框架,把数据集按正曲率、负曲率和近零曲率来分组。这个工作其实给我们的提醒是:在评估模型的时候,不能只看一个总分,要看模型在什么样的结构上擅长,在什么样的结构上不行,这对做应用的人来说其实非常重要。
说完评估的问题,我们来看一个方法层面的进展。
持续学习大家都不陌生,模型要在连续的任务流中保持能力不衰减。这篇《TailLoR》提出了一个基于谱分解的参数高效微调方法。它利用预训练权重分解出的奇异值分解的 U 和 V 矩阵作为一个固定的参考系,然后只在奇异值矩阵上学习一个低秩更新。这个设计很巧妙的地方在于,它引入了一个软谱惩罚项,用来阻止模型去更新那些主要奇异方向,因为这些方向对应的是模型已经学到的核心知识。通过这种方式,把细粒度的适应压缩到那些不那么重要的长尾奇异方向上,从而减少任务之间的干扰。这个思路其实给我们提供了一个新的视角:与其想着怎么防止遗忘,不如想想哪些参数是"可以忘"的,哪些是"不能忘"的。
接下来这个工作就有点意思了,是关于人形机器人控制的。
《HANDOFF》这篇论文讨论的是一个很实际的问题:当我们让人形机器人在真实世界里做事的时候,规划层和控制层之间需要一个什么样的接口?现有的全身控制器通常需要非常密集的运动学或空间参考,但规划器很难从任务语义直接合成这些密集的参考。作者的做法是定义了一个非常紧凑明确的接口,这个接口足够直观、通用、可组合,而且表达力足够丰富。然后他们用多教师 KL 蒸馏的方式,从三个互补的专家那里学习:一个做带安全滤波的全身运动跟踪,一个做运动,一个做跌倒恢复。把这三个专家的能力蒸馏到一个混合专家的学生模型里。这个工作让我觉得有意思的是,它不是在追求一个更强的单一控制器,而是在思考怎么设计一个好的接口,让规划和控制能够解耦,这可能是未来机器人系统的一个关键。
然后我们来看代码模型这边的一个进展。
《Code2LoRA》要解决的问题是:代码语言模型需要仓库级别的上下文来解析 import、API 和项目规范。现有方法要么把很长的上下文直接输入模型,要么就是对每个仓库做微调或者 LoRA,但前者推理开销大,后者维护成本高,特别是在代码库不断演化的情况下。这篇论文提出的 Code2LoRA 是一个超网络框架,它可以生成仓库特定的 LoRA 适配器,从而在零推理 token 开销的情况下注入仓库知识。而且它支持两种场景:静态版本适合理解稳定的代码库,演化版本则通过一个 GRU 的隐藏状态来跟踪代码的 diff 变化,适合活跃开发的场景。这让我想到,这其实是一个把持续学习或者说适配能力,推向了更细粒度的表现:一个模型要能快速适应每一个不同的代码仓库。
最后一篇是关于机器人控制速度的。
《TempoVLA》关注到一个很有趣的现象:机器人在做操作任务的时候,低风险的移动阶段需要快速执行,而高风险的接触阶段需要慢速精确的运动。但现有的视觉语言动作模型 VLA 在训练时继承的是一个固定的速度。作者发现,其实每个动作预测的幅度本身就决定了机器人移动的速度,这是一个可以直接控制执行速度的通道。TempoVLA 就是利用这个观察,设计了一个单一的可控速度的 VLA。它结合了两个组件:数据端的可变速度数据增强,以及推理端的动作幅度调节。这样同一个模型既可以快也可以慢,可以根据任务需求动态调整。这个工作的一个重要启示是:模型的能力往往比我们预设的要丰富,关键是要找到那个可以让我们主动调控的杠杆。
好了,今天的五篇论文都聊完了。我最大的一个感受是,这几篇文章其实都在回答同一个问题,那就是"如何让模型更好地适应不同的情境"。无论是评估时按几何性质分层,持续学习时区分核心和长尾参数,机器人控制时设计灵活的接口,还是代码模型和 VLA 的各种自适应能力,都指向了一个趋势:我们不再满足于一个在固定数据上训练出来的单一最强模型,而是在追求一种更具适应性的智能。这种适应性可能才是未来模型最关键的能力。
好了各位,今天的播报就到这里,祝大家周末愉快。