ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖

[db:作者] · 发表于 2025-10-22 13:05

编辑：桃子好困
【新智元导读】ICCV最好论文新颖出炉了！今年，CMU团队一无所获，斩获最好论文奖和最好论文提名。同时，何恺明团队论文，RBG大神提出的Fast R-CNN，十年后斩获Helmholtz Prize，实至名归。

ICCV 2025大奖公布了！
刚刚，ICCV官方组委会公布了今年最好论文奖、最好门生论文奖，以及对应的声誉提名奖。
来自CMU团队因提出BrickGPT摘下了「最好论文」桂冠，以色列理工学院团队FlowEdit拿下了「最好门生论文」。

值得一提的是，一篇曾由何恺明、张祥雨、任少卿和孙剑颁发于十年前的论文，荣获Helmholtz Prize。
这篇论文可谓深度进修范畴的里程碑，因提出PReLU等技术，让机械在ImageNet上识别毛病率远超人类水平。

今年，ICCV共收到了11239篇论文，录用论文2500+，超往届范围。
最引人留意的是，超一半作者，都来自中国（大陆50%+香港2.5%）。

作为计较机视觉三大顶会之一，ICCV每两年举行一次，今年于10月19日-23日，在夏威夷檀香山举行。

最好论文：CMU成最大赢家

今年，最好论文（也称Marr Prize）颁给了CMU团队，因开创文本到3D天生技术，打造出稳定可建的物理结构。

这篇论文初次提出了一个从文本描写间接天生物理稳定、可现实建造的「积木结构模子」的全流利方式——BrickGPT。
为此，团队构建了StableText2Brick数据集，包括超47,000个积木结构，涵盖28,000多个自力3D物体。

论文地址：https://arxiv.org/pdf/2505.05469
每个都配有具体文本描写，并保证物理稳定性。
然后，他们基于此，练习了一个自回归大说话模子，经过下一token猜测来揣度下一块应增加的积木。
为了提升天生设想的稳定性，作者又在推理时引入「有用性检查」和「物理感知回滚」机制，操纵物理定律与组装约束，实时剪枝不成行的token猜测。

尝试表白，BrickGPT可以天生稳定、多样且美妙的积木结构，并与输入文本提醒高度符合。
此外，他们还开辟了一种基于文本的积木纹理天生方式，以建立带有色彩和纹理的设想。

成果证实，所天生的设想既可由野生手动组装，也能经过机械臂自动搭建。

最好论文声誉提名

ICCV最好论文声誉提名，也颁给了CMU团队，因创新性提出一种用于全景深成像的新型镜头与算法框架。

这篇论文打破了久长以来，传统镜头「一次只能对一个平面清楚对焦」的根基限制。
具体来说，研讨职员设想了一种由Lohmann透镜和纯相位空间光调制器组成的光学系统。
这使得每个像素，都能自力地对焦于分歧的深度。

论文地址：https://imaging.cs.cmu.edu/svaf/static/pdfs/Spatially_Varying_Autofocus.pdf
他们还将典范自动对焦技术扩大至空间可变场景：
操纵对照度和视差线索迭代预算深度图，从而使相性可以慢慢伐整景深以顺应场景的深度。

相较于以往的研讨，最新方式间接从光学层面获得「全清楚」的图像，实现了两大关键冲破：
可以同时使全部场景清楚对焦可以连结最高的空间分辨率

最好门生论文

以色列理工学院团队拿下了ICCV「最好门生论文」，进献在于——操纵文本到图像流模子，实现免反演的文本图像编辑。

当前，基于预练习文生图（T2I）模子的图像编辑，常常需要经过反转、干涉采样实现，却存在庞大缺点。
由于纯真的反转，常常没法完善重建原始图像，致使编辑结果不理想。
而且，针对一种模子架构设想的干涉采样方式，很难间接迁移到另一种架构上。
为此，研讨职员提出了FlowEdit，一种用于预练习T2I流模子的文本图像编辑方式，该方式无需反演、无需优化且模子无关。

论文地址：https://arxiv.org/pdf/2412.08629
FlowEdit的精华在于，构建了一个全新的常微分方程（ODE）。
它间接在「源散布」与「方针散布」之间映照，并实现了比反演方式更低的传输本钱。
论文中，经过在Stable Diffusion 3和FLUX尝试，证实了FlowEdit的SOTA编辑结果。

最好门生论文声誉提名

来自UT-Austin、Adobe、康奈尔大学团队，获得了最好门生论文光荣提名，因基于未知姿势图像的自监视光芒进修推动3D分解而获奖。

这篇论文提出了，一种无需3D标注数据即可从2D图像中进修3D场景暗示的新方式——RayZer。
具体来说，RayZer将未知姿势、未经校准的图像作为输入，规复相机参数，重建场景暗示，并分解新视角。

论文地址：https://arxiv.org/pdf/2505.00702
在练习进程中，RayZer仅依靠本身猜测的相机姿势来衬着方针视图。
是以，无需任何相机真值标注，使其可以仅经过2D图像监视停止练习。
RayZer之所以能出现出3D感知才能，首要归功于两大关键身分——
一个自监视框架：经过解耦相机与场景的暗示，实现了对输入图像的3D感知自动编码。

一个基于Transformer模子：其唯一的3D先验是可以同时毗连相机、像素和场景的光芒结构。

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(1)

在新视角分解使命上，与那些依靠实在姿势信息「oracle」方式相比，RayZer获得了更优性能。

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(2)

十年封神之作，何恺明团队获奖
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(3)

Helmholtz Prize

两年一度的Helmholtz Prize由IEEE形式分析与机械智能（PAMI）技术委员会在每届ICCV大会上颁布，以表彰为计较机视觉范畴做出根本性进献的功效。
奖项以19世纪德国医生、物理学家Hermann von Helmholtz（赫尔曼·冯·亥姆霍兹）的名字命名，专门表彰十年前颁发于ICCV、并对计较机视觉研讨发生了深远影响的论文。
今年获奖的论文有两篇，别离是2015年何恺明、张祥雨、任少卿和孙剑颁发的「Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification」，以及Ross Girshick颁发的「Fast R-CNN」。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(4)

论文地址：https://arxiv.org/abs/1502.01852
本研讨从两个方面探讨了用于图像分类的批改线性神经收集。
首先是，提出了一种参数化的批改线性单元（Parametric Rectified Linear Unit, PReLU），它是对传统批改单元的泛化。PReLU可以提升模子拟合结果，且几近不带来额外计较开销，过拟合风险也极低。
其次是，推导了一种出格针对批改单元非线性特征的妥当初始化方式。从而可以间接从零起头练习极深层的批改收集模子，并对更深或更宽的收集架构停止摸索。
基于PReLU收集（PReLU-nets），团队在ImageNet 2012分类数据集上获得了4.94%的top-5测试毛病率。相较于ILSVRC 2014的冠军模子GoogLeNet（6.66%），性能相对提升了26%。
而这，也是在这项视觉识别应战中，初次有研讨功效超越了人类的表示水平（5.1%）。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(6)

论文地址：https://arxiv.org/abs/1504.08083
本文为方针检测使命提出了一种快速地区卷积收集（Fast R-CNN）方式。
Fast R-CNN操纵深度卷积收集对候选地区停止高效分类，并引入多项革新，在提升练习和测试速度的同时，也进步了检测精度。
在练习VGG16这一深度收集时，Fast R-CNN的速度是R-CNN的9倍，测试速度则快213倍，并在PASCAL VOC 2012数据集上获得了更高的均匀精度均值（mAP）。
与SPPnet相比，Fast R-CNN在练习VGG16时的速度快3倍，测试速度快10倍，且精度更高。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(8)

Everingham Prize

Everingham Prize授与的是那些为计较机视觉社区做出严重进献的研讨者或研讨团队。
奖项以Mark Everingham命名，旨在纪念并激励先人跟随其脚步，为鞭策计较机视觉社区的整体成长做出进献。
Everingham Prize每年在计较机视觉范畴的顶级会议上颁布一次。偶数年于欧洲计较机视觉会议（ECCV）颁布，奇数年则于国际计较机视觉会议（ICCV）颁布。
今年获奖的，别离是SMPL Body Model团队，以及VQA团队。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(9)

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(10)

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(11)

Azriel Rosenfeld毕生成就奖

Azriel Rosenfeld毕生成就奖表彰的是在全部职业生活中为计较机视觉范畴做出严重进献，并对该范畴的成长发生非凡影响的研讨学者。
今年获奖的Rama Chellappa，是约翰霍普金斯大学电气与计较机工程及生物医学工程专业的彭博精采教授，同时兼任数据科学与野生智能专项计划的姑且主任。
他在计较机视觉、形式识别和机械进修范畴的建立，已对生物识别、智能汽车、法医学以及面部、物体和地形的二维与三维建模等偏向发生了深远影响。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(12)

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(12)

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(13)

大会整体

最初，再来看一下今年ICCV大会，整体的情况。
上一届ICCV 2023曾收到了8620篇论文，审稿人6990名，地区主席（AC）有311人，法式委员会（PC）有5人。
再来看今年，投稿数目激增超2600篇，审稿人、AC人数大幅增加。
可见，这一届的ICCV范围，堪比CVPR 2025。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(14)

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(14)

按照细分范畴，今年在「图像和视频分解和天生」范畴投稿量最多，录用量也是最高的。其次是「基于多视角与传感器的3D重建」、「多模态进修」等范畴，成为投稿热门范畴。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(15)

同时，大会还公布了「桌拒」的成果——
审稿极为不负义务：28篇做弊剽窃：2篇两重投稿（同一篇论文同时投给顶会/学术期刊）：62篇匿名违规：38篇篇幅太长：37篇模板（间距）利用不妥：13篇无参考文献、虚拟参考文献：3+1篇停止日期后更新web：2篇
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(16)

今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(16)

除了2019年的最高值，今年ICCV注册参会人数再创新高。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(17)

ICCV组委会成员中，有很多我们熟悉的面孔，包括谢赛宁等人。
今日热点-ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖(18)

参考材料：
https://x.com/ICCVConference/status/1980704802691858682

ICCV 2025最好论文出炉！何恺明、孙剑等十年典范之作夺奖

本帖子中包含更多资源

浏览过的版块