潘金山南京理工大学

南京理工大学潘金山教授访谈



2019920日,专委秘书处采访了南京理工大学博士生导师,2019年国家优秀青年科学基金获得者,潘金山教授。下面是采访实录。

潘老师,您好!首先,请您介绍一下您的研究经历,分享一下您的研究经验。

首先,非常感谢专委会为我们提供这样一个交流平台。我本科的专业是信息与计算科学,硕博的专业是计算数学。2017年博士毕业于大连理工大学数学科学学院。曾在哈佛大学、加州大学Merced分校访问过。目前主要从事图像去模糊及相关复原和增强问题的研究。我从本科到博士读的都是数学相关专业,第一次接触计算机视觉相关问题,是从我研究生阶段师从大连理工大学苏志勋老师开始的。那时候第一次感受到数学的魅力不仅在于漂亮的公式和定理推导,许多曾经学过的优化方法和理论也可以用来帮助解决计算机视觉的相关问题。我一直认为打好数学的基础对之后从事计算机视觉相关问题的研究是十分重要的,所以我从本科到博士阶段的相关数学专业课程也是为我之后的研究打下了一定的基础。在攻读博士期间,我通过国家留学基金委提供的联合培养方案到加州大学Merced分校和哈佛大学进行了访问学习。也是这段学习经历让我更深入快速地接触到了计算机视觉方向的前沿,与许多教授前辈们也产生了很多想法上的火花。所以多交流讨论对于我们做科学研究来说也是十分重要的。

您在图像去模糊、图像复原和增强方面有很多的研究成果,能否跟大家谈谈该领域的一些研究现状和未来发展趋势呢?

图像去模糊及相关复原和增强问题是一个典型的逆问题,其研究目标是从给定的低质量的图像中有效地计算出高质量的图像,它一方面有助于解决低质量图像难于分析的问题,另一方面使得复原的图像以较好的视觉效果呈现出来,提高终端用户体验或者有利于后期编辑。目前大部分工作基于已有的物理退化模型,从给定的退化图像中挖掘有效的先验知识来估计退化图像到清晰图像的映射。因此,物理退化模型以及先验知识是这一问题的核心。传统的方法大多通过先验建模的方式来解决这一问题。

近年来,深度学习在解决高层视觉问题中取得了很大的成功。受此启发,一些学者开始尝试用深度神经网络解决图像复原及相关底层视觉问题。这类方法通常以要处理的图像/视频等数据作为网络的输入,在不经过人为干预的条件下,直接从观测图像/视频中估计出潜在清晰图像/视频。深度学习给解决图像复原和增强提供了一种有效的方法,并且在某些问题(比如超分辨率)上面取得了显著的进展。这也是目前研究相对较多的一类方法。

关于未来的发展趋势,在这里我结合自己的一些研究,说一下自己的看法。考虑到实际退化过程比较复杂,如何从物理成像过程的角度理解退化机理并给出有效的物理成像模型是目前解决相关问题的一个趋势。其次,由于传统的先验建模的方法大多依赖于人工设计的特征,而传统的深度学习的方法大多基于“黑箱”的工作方式,所带来的一个核心的问题就是对于埋藏在深度学习背后的运行机理没有研究清楚,因此,如何将两者有效地结合起来,充分利用两类方法的优点是目前研究的一个趋势。再次,虽然高质量的图像是图像复原和增强所追求的目标,但是,一方面,现有的评价高质量图像的客观指标和主观指标存在着鸿沟;另一方面,复原出的高质量图像能否真正有助于后续智能化分析问题(如人脸识别、车牌检测与识别等)还有待进一步研究。

您近期在VALSE上组织了一期去雨与雾专题“雨雾云收望远山”,作为主办AC,能跟我们介绍一下您当时的想法么?您对这期的专题有何评价呢?

这一期主要由刘家瑛老师、赵洋老师和我来主办。雾霾、雨等因素是造成户外图像退化的主要因素,在这些环境下拍摄的图像往往质量较低,从而严重影响了后续相关智能化分析任务。近年来关于图像去雾、去雨相关工作被大量提出,相关研究受到了广泛的关注。这个专题的目的是更好地使相关老师和同学了解问题研究现状和未来发展趋势。

我们邀请了相关领域的专家,包括张赫、任文琦、孟德宇、左旺孟等老师。这几位老师对图像去雾、去雨等相关复原问题进行了深入探讨。通过这一专题,专家们对近几年图像去雨和去雾的发展趋势给出了细致的总结和建议,为未来的研究提供了宝贵的建议。

2016年底曾在商汤科技工作过一段时间,能介绍下您与商汤的合作情况及您的主要工作内容么?您是如何看待或评价此段经历的?

商汤科技是AI领域的领军企业,在计算机视觉等相关问题上有深厚的技术积累。我在商汤科技的那段时间主要从事图像去模糊和超分辨率问题的研究。通过这段经历,进一步了解到自己所从事的研究和实际需求之间的关联性。这一经历给我最深的启发就是以往自己都是针对一些well-defined的问题进行研究,而实际问题往往不是well-defined,如何从实际问题中凝练出研究问题,从而给出有效地解决方案是很关键的。

您于2015年期间在哈佛大学做过一段时间的访问学者,您能介绍下您在这期间的研究经历吗?可否和大家分享一下您对哈佛大学研究氛围的分析和评价?

我在哈佛大学的视觉计算组跟Hanspeter Pfister教授和Deqing Sun博士从事图像/视频去模糊问题的研究。

我所在的研究组主要从事计算机图形学、计算机视觉等相关问题的研究。组内报告和交流比较多。每周都会有相应的组会,在组会上每个人都会分享一些自己所看的论文以及研究成果。除此之外,经常会有相关的领域的知名学者来组里进行报告交流。通过聆听不同领域的报告以及与这些学者的交流,可以有效地拓宽自己的研究视野,同时也会在交流中产生一些新的想法。

能介绍一下您现在的研究团队,以及您对团队的管理和规划么?

南京理工大学智能媒体分析实验室(IMAG)是唐金辉教授建立的一个科研团队。主要成员包括多媒体分析与理解、计算机视觉等方向的老师和同学。我们的研究团队有浓厚的学术氛围,每年都有研究成果在相关领域顶级期刊和顶级会议发表。关于团队的管理和规划,我目前也正在探索和学习中。

您在TPAMICVPR等国际知名期刊/会议上发表了很多高水平的论文,能为研究生们如何冲刺高水平论文提供一些建议么?

高水平的论文离不开论文本身的质量以及论文的写作。论文的质量离不开知识的积累。关于我自己的科研经历,在这里主要感谢大连理工大学苏志勋教授、北京大学林宙辰教授以及加州大学Merced分校的Ming-Hsuan Yang教授、的指导。他们做出了很多高水平的研究工作并且也将高水平论文的经验和建议放在他们的主页以及相关论文写作的课程上。具体可以参考http://faculty.ucmerced.edu/mhyang/course/eecs286-2016/index.htm


潘金山

南京理工大学计算机学院教授、博士生导师。2017年毕业于大连理工大学数学科学学院,获博士学位。曾在哈佛大学和加州大学Merced分校访问研究两年。主要从事图像去模糊、图像复原等相关底层视觉问题的研究。近年来,在CVPRICCVECCV等国际会议以及IEEE TPAMIIJCV等重要国际期刊上发表论文40余篇,其中CCF推荐A类论文30篇。根据Microsoft Academic统计的近5年最具影响力的全球学者排位,位列图像去模糊领域第2位。获得了中国人工智能学会优秀博士学位论文奖以及辽宁省优秀博士学位论文奖。2019年获得国家优秀青年科学基金资助。

                                       (责任编辑:余烨 黄岩 张汗灵)