左旺孟哈尔滨工业大学


哈尔滨工业大学左旺孟教授访谈


2020年6月8日,《CCF-CV专委简报》在线采访了哈尔滨工业大学计算机学院博士生导师左旺孟教授。下面是采访实录。

李老师,您好!首先,请您介绍一下您的个人学习和研究经历。

我的经历非常简单,从1995年大学入学开始,学习和工作都一直在哈尔滨工业大学。唯一可以说的就是本科和硕士学的是材料学,从博士入学起就一直在计算机学院学习和工作。


您近年来做了一些生成式对抗网络和迁移学习方面的工作,能否介绍一下您在这几个方面的研究情况和相关研究成果?

很大程度上我们对视觉应用研究得更多一些。对于生成式对抗网络(GAN),我们其实是在研究图像去噪和图像超分辨过程中,发现使用标准的MSE损失往往会使得重建图像有一定的over-smoothing现象。因而从2016年开始考虑能否与生成式对抗网络相结合,利用对抗损失改善重建图像质量,同时借鉴底层视觉之前的损失函数来避免GAN训练的不稳定性。对于迁移学习,我们其实也是考虑到深度学习的成功很大程度上依赖于大量的标注数据,觉得有必要关注和开展些迁移学习和自监督学习方面的工作。

实际上,我们在生成式对抗网络方面主要是依托人脸属性编辑、引导人脸增强和图像修复等具体任务在做,我们在迁移学习和自监督学习方面的工作也主要是依托领域自适应、图像压缩和图像去噪等具体任务在做。


您在顶级期刊和顶级会议上发表了论文100余篇,在论文发表方面取得了突出成绩,能跟大家分享一下您是如何做到持续产出高水平论文的呢?

       无论是从学术界还是产业界的角度来看,底层视觉和图像生成都属于我们国家与国外差距相对较小的领域。尤其是底层视觉方面,港中文的SRCNN和我们的DnCNN对近年来图像超分辨和图像去噪的发展也都起到了一定的推动作用。图像生成方面国内的论文数量和质量也并不比国外差,但还是缺少一些有影响力的模型和框架如Pix2pixCycleGANStyleGAN等,希望大家今后能在这些方面继续努力


您在顶级期刊和顶级会议上发表了论文100余篇,在论文发表方面取得了突出成绩,能跟大家分享一下您是如何做到持续产出高水平论文的呢?

不敢说有什么经验。我会倾向于给学生较大的自由度,在自己还能给些指导的前提下尽可能让他们做自己感兴趣的方向,但会鼓励他们一定要去关注应用或方法层面上有价值的问题和给出有新意的解决方案。另外,在做的过程自己也会尽可能参与进去,一起讨论、调整和完善方案,起到互相促进的效果。不过我自己也不确定这种方法是否有普遍性或者是不是一种正确的方式。


您的论文具有很高的引用次数,能跟大家分享一下您在学术影响力方面做了哪些努力呢?

论文的引用次数其实有很大的偶然性。很多时候同一个想法可能会同时出现在多篇论文中,但往往只有其中的一两篇会得到大部分的关注。我自己更倾向于尽可能保证论文的贡献和完成质量,这种做法一方面有助于提升论文被大家关注的可能性,另一方面万一真得到比较多的关注时也不至于太尴尬。如果非要分享些经验的话,可能就是尽可能做有用的研究。


您于2018年12月曾获得“北京航空航天大学优秀教学奖二等奖”,请问能否跟大家分享一下您的获奖经历,以及您的教学经验?

首先声明,这个奖并不难,我们学院的老师在2018年获得了一个一等奖和四个二等奖。不过当时我只是第二年从事教学工作,能获奖还是有点意外。究其原因,还是在于“感同身受”四个字。我在上课时,经常会想,如果是我坐在下面,凭什么不让我玩手机而是去听课呢?答案很简单,把课程讲得比微信朋友圈的段子更有趣,比王者荣耀参与度更强,比网络小说的包袱更多,自然就能吸引学生。当然,做到这几点很难,我也在不停的尝试和改进。另外,还有很重要的一点是,把每个听课的学生,都当成自己“名下”的学生,希望他们能真的学到东西,而不是走形式凑课时,学生自然能感受得到,也会给出相应的反馈。由于我还是教学领域的新兵,很多事情还在摸索,这些经验未必正确,仅供大家参考。



您担任过多个顶级学术会议的领域主席,能介绍一下您参与组织这些会议的经验吗?另外,在与国内外同行交流时,怎样才能获得更好的效果呢?

我目前只担任过ICCVCVPR的领域主席,体会比较深的就是AC Meeting时领域主席会认真讨论每篇论文的原创性和启发性,会更愿意推荐有新意的论文。这在一定程度上也促进和保证了计算机视觉领域的繁荣和多样性,许多学者也愿意做一些有趣的和基础性的研究尝试。在跟国内外同行交流时,会鼓励学生能够提前读相关的论文,通过面对面的交流澄清自己对论文内容的疑惑,就具体开展工作时的经验体会和对领域的认识等也会进行一些沟通。


可否请您谈一下在后深度学习时代,计算机视觉技术将如何发展?面临哪些挑战?哪些研究方向会特别有价值呢?

我自己也很认同深度学习的浪潮肯定会逐渐过去,但深度学习时代发展起来的一些方法和思维模式,如通过设计恰当的网络和损失函数来训练一个具备某种功能的模型,在后深度学习时代应该会被保留下来被大家继续使用。至于后深度学习时代的研究,我可能会建议希望大家能更关注于解决计算机视觉自身的问题(如新型视觉传感器、内容生成、视觉认知、视觉与语言/机器人的结合),同时也能以比较开放的心态拥抱和利用学习领域的最新进展。


请问您是怎么管理研究生的?您对他们的要求是什么?

刚开始时会希望他们能围绕一个我比较熟悉的任务开展研究,便于有问题及时发现和调整,也锻炼下他们的代码、实验和写作能力。随后,会逐渐加强研究生的自主性,希望他们能够根据自己的兴趣定义一些有趣的问题,做出些有新意和有价值的工作。对研究生的论文发表并没有确定性的规定,主要是满足学校和学院毕业要求,但会希望他们能锻炼出独立和合作做研究的能力,以及保证学位论文的高质量完成。

如果让吐露研究者心声,您最想说的是什么?

     

希望大家都能做出更有价值和影响力的成果,一起努力推动中国乃至世界计算机视觉领域的发展。


责任编委 赵振兵 余烨


孟

左旺孟

哈尔滨工业大学计算机学院教授、博士生导师。主要关注生成式对抗网络、迁移学习模型及其在底层视觉、图像生成、视觉跟踪、图像分类等领域的应用。在CVPR/ICCV/ECCV等顶级会议和T-PAMI/IJCVIEEE Trans.等顶级期刊上发表论文100余篇,谷歌学术引用15,000余次,谷歌学术H-Index62。发表ESI高被引论文8篇。提出的DnCNN模型被正式收入MATLAB 2017b及后续版本的Image ProcessingDeep Learning Toolbox,并被CV-News Magazine作为Main Story专题报道,目前最高单篇引用1900余次。担任人工智能学会模式识别专委会常委、中国图象图形学会机器视觉专委会常委、中国图象图形学会青工委执委,国家自然科学基金重点项目负责人。担任ICCV 2019CVPR 2020/2021CCF-A类领域主席及IJCAIAAAICCF-A类会议高级程序委员,担任ECCV AIM 2020竞赛单元主席之一。