2013 计算机视觉国际会议简报

主题词:计算机视觉,国际会议

会议概况

第14届计算机视觉国际会议(ICCV, International Conference on Computer Vision)于2013年12月1日至8日在澳大利亚悉尼市召开。该会议由美国电气和电子工程师学会的计算机学会(IEEE CS,Institute of Electrical & Electronic Engineers Computer Society)主办,通常在北美、欧洲、亚洲等各国举行。作为计算机领域世界顶级的学术会议之一,计算机视觉国际会议每两年举办一届。

本届大会主席是美国马里兰大学的Larry Davis教授和澳大利亚国立大学的Richard Hartley教授,程序委员会主席由来自加拿大多伦多大学的Kyros Kutulakos教授,微软亚洲研究院的Yi Ma博士,美国华盛顿大学的Steve Seitz教授以及英国布鲁克斯大学的Philip Torr教授共同担任。

ICCV历来采用Single Track模式,在为期4天(12月3日至6日)的主会期间共安排了11场口头报告会和8场海报展示会,口头报告会分别涉及目标识别、计算摄影学、三维视觉、底层视觉、运动和跟踪、最优化方法等主题,期间穿插安排了8个spotlight介绍会,使每一篇海报论文的作者都有机会在台上用45秒钟宣讲自己的创意和思想,以吸引参会者关注后面的Poster展示环节。

继ICCV2011邀请交叉领域学者做Keynote之后,本次大会也邀请了诺贝尔物理学奖获得者、澳大利亚国立大学的Brian Schmidt教授做特邀报告,Schmidt教授深入系统的介绍了他在天文学方面的主要工作,并且结合外太空观测的技术需求,给出了未来天文学与计算机视觉交叉的研究方向。

在大会召开期间,围绕计算机视觉中的稀疏和低秩表达(Sparse and Low-Rank Representations in Computer Vision)、稀疏估计和鲁棒学习(Sparsity Estimation and Robust Learning)、计算机视觉中的决策森林和决策场(Decision Forests and Fields for Computer Vision)等理论和方法,大会一共安排了9个tutorials。同时,大会还组织召开了25个研讨会(workshop),分别就场景理解的图模型:挑战与前景(Graphical models for scene understanding: challenges and perspectives)、可视目标跟踪挑战(IEEE Workshop on the VOT2013 Visual Object Tracking Challenge)等专题开展研讨。

研究论文及热点

ICCV是计算机视觉领域最高级别的会议之一,会议的论文集代表了计算机视觉领域最新的发展方向和水平。计算机视觉国际会议的收录率较低,图1给出了2001年以来历届ICCV接收的论文投稿数量和最终录用的口头与海报论文数量对比。

ICCV的所有投稿采用双盲方式评审,每篇论文由至少3名审稿人评审,随后由相应领域的主席(Area Chair)协调讨论并推荐,最后由程序委员会主席决定最终结果。本次大会共收到1629篇投稿,录用大会口头报告(Oral)论文41篇(录取率为2.5%),录用会议海报(Poster)论文413篇(录取率为25.4%)。

iccv2013-paper

图1 2001年以来历届ICCV接收的论文投稿数和最终录用的口头与海报论文数对比

表1给出了ICCV2013不同研究方向投稿数量及其在整个大会投稿中所占的比例,以及各个方向的录用数量及录用率。从中可以看出,“识别、检测、分类、索引及匹配”是当前计算机视觉技术的研究热点,“三维计算机视觉”、“运动和跟踪”、“视频分析:事件、活动及监控”等依然是计算机视觉领域的重要研究方向,这4个方向的投稿量超过了大会总投稿量的一半以上,得到研究人员的广泛关注。

表1 ICCV2013各个研究方向投稿量和录用情况

主题

投稿量/占比

录用量/录用率

Recognition: detection, categorization, classification, indexing, matching

识别:检测、分类、索引及匹配

444/27.3%

138/31.1%

3D computer vision

三维计算机视觉

153/9.4%

41/26.8%

Motion and tracking

运动和跟踪

148/9.1%

38/25.7%

Video: events, activities & surveillance

视频分析:事件、活动及监控

146/9.0%

42/28.8%

Face and gesture

人脸与体态

143/8.8%

40/28.0%

Low-level vision and image processing

底层视觉和图像处理

132/8.1%

28/21.2%

Segmentation, grouping and shape representation

分割、聚类和形状表达

122/7.5%

31/25.4%

Statistical methods and learning

统计学习及方法

91/5.6%

22/24.2%

Computational photography, sensing and display

计算摄影学,传感与显示技术

87/5.3%

23/26.4%

Optimization methods

最优化方法

63/3.9%

24/38.1%

Physics-based vision and Shape-from-X

基于物理模型的视觉技术与结构恢复

29/1.8%

9/31.0%

Medical and biological image analysis

医学及生物学图像分析

25/1.5%

4/16.0%

Performance evaluation

性能评估

14/0.9%

4/28.6%

Vision for the web

面向互联网的视觉技术

11/0.7%

2/18.2%

Vision for graphics

面向图形学的视觉技术

9/0.6%

5/55.6%

Document analysis

文本分析

6/0.4%

3/50.0%

Robotics

机器人相关技术

6/0.4%

0/0.0%

在研究热点方面,以大数据为基础、深层特征表达为核心、跨越特征语义鸿沟为目标的图像中物体检测、分析与识别将在未来一段时间内继续成为热点。大会共有4个口头报告会的主题涉及目标识别,其中大部分工作都从宏观层面介绍了解决特征表达问题以及特征语义鸿沟问题的理论和技术趋势。例如:MIT的Carl Vondrick等人的论文“HOGgles: Visualizing Object Detection Features”将用于目标检测的多层特征可视化出来,以一种全新的方式展示了目标检测系统中特征的表述能力以及目标检测失败的原因。NEC研究院的Xiaoyu Wang等人的论文“Regionlets for Generic Object Detection”定义了用于表达特征提取的一个基空间,并在此基础上提出了集成多种区域特征的级联式分类方法。来自法国中央理工大学(Ecole Centrale de Paris)和INRIA的Iasonas Kokkinos的论文“Shufflets: shared mid-level parts for fast multi-category detection”揭示了中层特征元素的学习方法以及从不同类别中共享结构特征的方法,从而为形变部件模型提供部件和整体模板。CMU的Xinlei Chen等人的论文“NEIL: Extracting Visual Knowledge from Web Data”给出了从大规模网络图像数据中提取视觉知识的框架,他们借助半监督学习算法挖掘了给定视觉类别之间的一般关联和实例标注。

本次大会在视频运动分析和视觉目标跟踪这一传统方向安排了2个口头报告会。在运动分析方面,INRIA的Philippe Weinzaepfel等人的论文“DeepFlow: Large displacement optical flow with deep matching”提出一种解决大尺度光流计算的新方法,其核心思想是采用多达6层的卷积网络和稠密采样获得快速运动场景的光流信息。同时,ETH Zurich的Christoph Vogel等人的论文“Piecewise Rigid Scene Flow”提出了从立体视频中获取三维稠密光流的方法,其核心思想是采用包括形状、运动和分割的正则化优化算法,估计各个平面的运动特性。在视觉目标跟踪方面,值得一提的是来自Temple大学的Yu Pang和Haibin Ling的论文“Finding the Best from the Second Bests – Inhibiting Subjective Bias in Evaluation of Visual Tracking Algorithms”,他们给出了一个类似于网页打分的类PageRank 算法,对近年的计算机视觉领域最流行的15种目标跟踪算法进行了较客观的评价。

除此之外,大会在三维计算机视觉、底层视觉、计算摄影学、最优化方法等方向也安排了1个专题的口头报告会,在此就不一一详述了,请读者根据个人研究兴趣阅读相关论文。

相关奖项

最佳论文奖(Marr Prize)

本届会议最佳论文——马尔奖(MARR prize)颁给了来自美国北卡罗来纳大学教堂山分校的韦森特•欧都尼兹(Vicente Ordonez)等人的“从大规模图像分类到初级类别表示”(From Large Scale Image Categorization to Entry-Level Categories)。论文为大规模图像分类提供了一种新的解决思路。

最佳论文提名奖(Marr Prize Honorable Mentions)

本届会议有2篇论文获得最佳论文提名奖,分别是来自美国卡内基•梅隆大学田渊栋(Yuandong Tian)等人的“用于高效最优形变估计的分层数据驱动的梯度下降法”(Hierarchical Data-driven Descent for Efficient Optimal Deformation Estimation)和来自苏黎世联邦理工学院的克里斯多夫•沃格尔(Christoph Vogel)等人的“分段刚性场景流方法”(Piecewise Rigid Scene Flow)。

PAMI-TC阿兹莉•罗森菲尔德终身成就奖(PAMI-TC Azriel Rosenfeld Lifetime Achievement Award)

该奖项颁给了荷兰代尔夫特理工大学(Delft University of Technology)的Jan Koenderink教授。Koenderink教授的研究兴趣是感知心理学和哲学,以及计算机视觉相关的理论和方法。

杰出成就奖(PAMI-TC Distinguished Researcher Awards)

该奖项颁给了美国加州大学伯克利分校(University of California at Berkeley)的Jitendra Malik教授和英国牛津大学(University of Oxford)的Andrew Zisserman教授。

Malik教授现任美国加州大学伯克利分校电子工程与计算机科学系的Arthur J. Chick教授,曾于2004~2006年任该系系主任。他的主要研究方向为计算机视觉和生理认知建模,涉及图像分割、纹理分析、立体视觉、物体识别、智能交通系统等广泛内容,在这些领域发表了超过150篇文章,其中有五篇文章引用率超过1000。其代表作有Normalized Cut, Shape context等,所有文章的总引用次数超过60,000次。

Zisserman教授现任英国牛津大学视觉几何研究所主任,他的研究方向涉及计算机视觉的多个领域,他与Richard Hartley合著的《Multiple View Geometry in Computer Vision》为多视几何领域的经典书籍,受到极其广泛的关注,他与Andrew Blake合著的《Visual Reconstruction》也被广泛引用,他发表文章超过150篇,所有文章的总引用次数超过60,000次。

霍尔赫兹奖(Helmholtz Awards 1987-1999)

本次大会将Test-of-Time Award更名为霍尔赫兹奖(Helmholtz Awards),该奖项旨在奖励那些在计算机视觉的相关领域产生了显著影响力的工作。在本次大会上主要奖励那些最初发表在1987到1999年之间ICCV上对于计算机视觉领域产生显著影响的工作,共遴选出15篇论文,其中包括David Lowe发表在ICCV1999的SIFT工作,这一工作累计引用超过两万次。这15篇论文中,两篇文章的主要作者为华人学者,分别是美国加州大学洛杉矶分校(UCLA)的朱松纯教授作为第一作者发表在ICCV1995的“Region Competition: Unifying Snakes, Region Growing, Energy/Bayes/MDL for Multi-band Image Segmentation”和微软研究院媒体、交互与通信组(MIC)的Principal Researcher张正友博士作为唯一作者发表在ICCV1999的“Flexible Camera Calibration by Viewing a Plane from Unknown Orientations”。

未来发展

由近年来计算机视觉方向顶级会议的论文收录统计来看,以下方向在相当长一段时间内仍然会是关注的重点:大数据环境下的计算机视觉新理论、计算机视觉方向与其它相关领域如机器学习的交叉研究、深度视觉特征的学习与应用等。

下一届计算机视觉国际会议将于2015年在智利圣地亚哥市举办。本次会议还投票决定了2017年计算机视觉国际会议的举办地点。竞争ICCV2017承办权的候选城市有法国巴黎和意大利威尼斯,2个候选城市的会议承办人分别就承办情况进行了详细的介绍,双方各有特色。最终,通过全体与会代表投票表决,ICCV2017的举办地点确定为意大利威尼斯。

附:简报原文ICCV2013简报