北京大学林宙辰教授访谈录

2016年12月12日,专委秘书处在北京大学理科2号楼采访了北京大学信息科学技术学院智能科学系林宙辰教授。

林老师,感谢您百忙之中安排时间接受我们的访谈,分享您研究过程中的经验!

您在计算机视觉领域取得了卓越的成就,获得了国家杰青基金,并当选为IAPR FELLOW。能否分享一下您的成功经验?

关于成功,我没有什么特别的经验,关键是得长期做一件事情,没有什么取巧的地方,且一定要积极、主动。我的运气比较好,毕业后就去微软工作,那个环境竞争性比较强,大家都有危机意识,天天要超越自我、赶超别人,一直都没有放松的时候。国内很多其他研究者条件也挺好,他们有好的研究,处于一个好的研究团队,有的导师是院士或者一个大课题负责人。我的导师是石青云院士,她早在02年就 去世了,所以我其实没借到她的力,基本上是靠我自己个人的努力,不过我得到了很多师长和朋友的帮忙,所以很感谢他们。

我是北大博士毕业的,毕业后导师希望我留校,那时条件与现在没法比,我没有考虑留校,直接到微软去了。2012年我回到北大,一方面是因为我们国家科研环境越来越好,提供的机会越来越多,另一方面是因为我的研究偏理论,微软讲究产品转化,虽然说研究很自由,但如果做一些没有明确应用前景、偏理论的研究,晋升的机会就很少,所以我决定回高校。做学术研究的话,高校自由度更大。

对于您取得的成就,能否谈谈感想?

其实没有什么大的成就,只是获得了一两个头衔而已。我觉得自己的研究工作还不够。我认为一个好的研究员身上应该有一个label,别人一提起你就知道你做了什么,就像提起SVM就想到Vapnik。最近周志华教授拿了Fellow大满贯,大家都知道他做的Multiple Instance Learning、Ensemble Learning,我觉得我还缺少这么一个label,我不觉得自己有多大成就,大家认可我就好。

从您所做的学术报告可以看出,您做的东西非常实在。

我本科是学数学的,学得比较扎实,理论推导要求很严谨,这也是我所追求的风格。有理论的论文在那里,大家都能推敲,所以一定要实在。我对学生的要求也是这样,我们要做的研究要有数学模型,虽然很多有意义的问题没有数学模型,但这不是我们的长处,我们不研究它们。

您对未来的研究有什么样的规划?

没有什么特别大的规划,基本上会沿着既有研究主线继续下去,我们如果想到一些重要的问题、看到一些重要的问题,就要去解决它。比如说,深度学习的一些优化理论、方法还需要一个坚实的基础。在技术应用方面,我没有什么特长,所以不打算从事这方面研究,但基础理论方面,我还会再进行一些深入的探讨。

您认为计算机视觉未来有哪些比较有潜力的研究方向,能否谈一谈您的观点?

首先,我认为对图像内容的分析需要更加精细,原来是对整张图像做简单的分类,将来要做精细的parsing。其实parsing早在90年代就已经有人开始做,主要是检测场景里面有哪些主要物体、给出它们的bounding box。目前的detection主要也是告诉你有没有感兴趣的物体、它们的边界在哪里,以后会要求做得更加准确,包括小类识别、小物体检测。其次,三维重建领域,即计算场景里面物体的三维形状,现在做的人比较少,远没有做识别的多,三维重建的一套理论,要学很久才能上手,比较有难度。三维重建在精度和速度方面还需要提升,尤其是复杂物体。还有,就是表面材质的估计,比如说我们怎么知道图像里某物体的表面是皮的还是玻璃的。这方面十几年前有不少人研究,现在大家都跑到识别上了,因为门槛比较低,物体的物理特性没多少人关心了。相信以后大家会重新捡起来。

其实,计算机视觉领域的问题基本都没有真正被解决过。面对同样的问题,大家在不断地提高精度、速度,不是说又冒出了新的问题,目前主要都是在老问题上不断寻求更优的解决方案。

能否介绍一下您的研究团队?

我在北大的团队主要是我和研究生,我在校外、国外有很多合作,尤其是之前在微软带过的实习生,有不少留在国内外高校,所以我的publication list上,很多都是和原来学生或在微软期间建立联系的同行们合作的。我觉得我人缘还不错,这点让我很开心。

北大的招牌大家还比较认可,招的学生还可以,但是名额很少,平均每年不到一个博士,硕士可以有1-2个,其他老师有希望让我帮他带学生的,也会把学生放在我这里。我招的博士里面,外校保送来的比较多。我对外校学生没有任何歧视,所有投递简历的我都认真回复。我有自己的一套测试学生的方法,有的学生原来学校很一般,但进来后做得非常好,虽然也有的学生没有达到我的预想,但都很积极努力。

您能否介绍一下在招收研究生时,您是如何考核他们的?

我之前在微软呆过,借鉴他们的方法,对学生要求“三好”,即数学好、编程好、态度好。态度的话,聊一聊就会知道,我也会让学生写一个statement,关于他们对未来研究的看法、career plan之类的。如果学生本科期间没什么投入,写得就会很泛,如果学生真正做了一些事情,他对这件事情会有体验,写得会很深入。数学和编程,我会分别出几道题目来考他们,一般都是一起考,4个小时。我对数学的要求要高于对编程的要求,会根据学生的情况最后综合考虑。总结起来,其实最关键的一点就是看学生有没有passion,有的话什么困难都会自己想办法去克服的。有不少北大数学学院的学生来找我,但很遗憾,绝大部分都没有passion,所以我基本没有接受。

请问您是怎样管理和要求研究生的?

北大对博士毕业的要求不高,学院要求2篇EI论文。当然,学生一般不会刚好发表2篇EI就毕业。门槛低有一点非常好, 就是学生不会有太大的压力, 急着去解决“短平快”的问题。我希望学生能解决一些根本性的、有难度的问题,一年出一篇论文即可。我不是为难他们,这些问题真的值得花时间去做,我们需要在上面有所投入。毕业要求低可以让学生放开去做这方面的尝试,如果一开始就要求有3篇Trans,那学生就会只卯着劲去发论文。

我自己对学生做得好坏是很清楚的,有的虽然在top conference上发了论文,但我内心清楚他们其实做得很一般。我不会完全按照论文发在哪里评价学生,有时候他们发论文的杂志或会议很一般,但我会很欣赏他们,因为他们在很艰难地啃着难题。就像我们做的基于学习的偏微分方程,我觉得就挺难的,但有学生仍在坚持做这个问题,我觉得应当鼓励。

我招学生时是很严格的,但招进来之后我会给他们一个问题,让他们自己去做,我不会特别push他们,比如要求每个星 期要做到一个什么程度,因为我也不知道能做到什么程度,我只要他们有在上面投入即可。他们有问题问我时,我会非常快地回复。如果是Email,我只要看到,基本是当时回复。改论文的话,基本是2-3天之内,我会把他们叫过来,跟他们说论文哪些地方写得不好、怎么修改。我不马上上手给他们改,太早上手给他们改会培养他们的惰性,他们对你会有依赖。我一般会带着他们写1到2篇论文,前2篇论文从头到尾比较详细地讲解,以后他们要自己独立处理。所以我的学生成长还是很快的,后面他们就自己找题目,跟我讨论确定题目是否值得做,如果值得,他们就自己开始做。经过几轮口头修改,他们的论文在投到会议或journal之前就已经写得比较好了。以前,最后一稿我给他们改改语法,现在有较好的英语自助编辑工具,我就建议他们用这样的工具。与这样的工具互动可以更快地提升英文写作水平。

对于计算机视觉领域的入门研究者,您对他们有什么建议?

我觉得一些经典的书、全面介绍Computer Vision 的教材还是要看的,比如David A. Forsyth和Jean Ponce写的《Computer Vision:A Modern Approach》,写得非常全面,从成像过程一直到后面的识别、重建等一整套。我们需要了解这个过程,了解Computer Vision发展史,像朱松纯老师前阵子在网上发的“初探计算机视觉的三个源头、兼谈人工智能”的帖子,他的看法我还是蛮认可的。了解历史可以让我们对学术流派比较了解,它可以让我们stay humble,因为了解历史,你就会知道自己做的其实是其中很小的一个improvement。

作为PAMI、IJCV编委和国际顶尖会议ICCV2015、CVPR2014/2016等的领域主席,能否谈谈您如何评价一篇稿件? 您对青年人撰写论文和投稿有什么建议?

作为编委,你不能过多参与决定,要把决定权给reviewer。这样,作者才会信服。我一般会尊重reviewer的决定,除非很自信自己看到了他们没有看到的东西,比如一篇文章n年前发过了,但文章的reviewer可能没看过,这种情况下我会去推翻reviewer的意见。这种情况非常少,绝大多数情况下我尊重reviewer的意见。

好稿件最重要的一点是idea要新颖,但现在大部分论文idea非常新颖的不多,真正让我看到眼前一亮的很少。我看过的稿件比你们看到的已经publish的要多很多,publish的是被接受的,其实被毙掉的占大部分。有的一看就不行,直接reject,比如有的排版不符合要求,有的符号乱七八糟,更不用说idea。除了idea要新,还有写作方面的要求,我以前也给过怎么写论文的topic。论文写得要符合逻辑,要让刚入行的人看得懂,实验要详尽,描述要正确。idea和写作两方面都要好。idea好的话,写作差一点有时可以得到原谅,但也有被拒的风险。有的论文idea一般,靠实验堆起来的,但reviewer说ok,你也不好拒绝。这种风气的确不是很好。沿着这个思路,你接受它的唯一理由只是因为你拒绝不了它,而不是因为它有多好。真正的好paper非常少。当然,出现这种现象的原因之一是论文实在太多,之二是算法越来越复杂,如深度学习的网络画得象电路图一样,审起来很费时间,直接看实验结果是最省事的审稿方式。对算法进行改进的论文,不能只是简单地改进,要有一套逻辑,论证其改进是有道理的,论文要有一大部分内容论证这个,如果没有合理论证,没法说服reviewer,在一些 top journal、top conference上难以被接受。

目前国内对paper的导向不太好,大家把paper看得很重,但其实paper是做研究的一个by-product,你只要沉下心去解决一个问题,把一个问题解决好,你写一篇好的paper是一件很自然的事情。但现在很多人就想着怎么去发paper,而不是想着怎么去解决问题,这就有点颠倒了。你如果真的解决好了问题,发一个顶级杂志的文章,问题不大。有好的idea和实验结果,写作也要跟上,科技论文的英语不需要特别花哨,关键是要准确表达你的意思,把方法正确地表达出来。

现在很多高校的评价体系很看重SCI论文,关于这一点您怎么看待?

我审过非SCI论文,与SCI论文相比,paper的质量差别还是很大的,且不说idea,单从写作上看,非SCI期刊论文的写作比SCI期刊论文明显要差,从introduction、related work的完整性,motivation的介绍,idea的technical detail以及实验的系统性,都薄弱了很多。也可能是因为导向的问题,导致大家不愿意把好的论文投到非SCI期刊上。

要提高写作水平还是要鼓励向好的journal投稿。当你达到一定水平后,可以不用这么做,只需更快地把paper publish出去。现在,大家把论文直接挂在arxiv上,投哪发哪是第二步的事情。对于初学者,建议尽量往好杂志和会议上投,与投差杂志和会议相比,得到的科学素养的锻炼是完全不一样的。

在大家眼里,您是一位非常棒的研究人员,请问您在生活中是什么样的?能否跟大家分享一下您的业余生活?

我在读书期间有很多爱好,打各种球,乒乓球、羽毛球、篮球,还爱好下棋、游泳、打牌、看各种闲书,不过现在基本都没有了。我以前对家里照顾很少,现在试着对家庭的事情多关心一点。我太太一直跟我说,子女的教育是很重要的,我很认同她的观点。锻炼方面,我现在主要做一个人的运动,最多的是跑步。我一般绕未名湖跑半个小时就回来,整理一下,然后继续工作。锻炼对缓解身体的不适和提高工作效率是非常有帮助的。

几年前偶然在您qq空间上看到了一段话,主要是关于您一位朋友的孩子在家庭遭遇变故后变得很沮丧,您不仅安慰他,还给他买了生日礼物,感觉您是一位很暖心的人。您平时怎样陪伴自己的孩子?

这件事很早了,我已经记得不是很清楚了,好像是有这么一件事。关于陪伴孩子的事,我做得挺多的,主要是陪她玩。我只要在家没出差,就会经常带她在小区里转悠。她做什么,我都不会禁止。有的家长担心小孩子摔跤,不让爬高,但我不禁止,我只是做好必要的保护措施,她可能是我们小区同龄孩子里第一个爬上树、爬上双杠的,所以她现在平衡感特别好。不出差的时候我早上送她到学校,下午如果没有开会我也会去接她回家。目前我在教她英语,我也不送她去英语班,平常自己教她。暑假我们全家也是要出去旅游的,我访问同行,她们玩。

请问您一般每天工作多长时间?

现在精力有点下降,工作时间稍少点,以前一直都在工作,基本没有节假日。除了接送孩子,晚上还工作2个多小时,休息的时间很少。不过,我周末基本不去实验室,我会把资料带着在家看;和学生交流经常通过邮件、微信和电话进行。

林宙辰,2000年于北京大学获得理学博士学位,现为北京大学信息科学技术学院智能科学系教授,国家自然科学杰出青年基金获得者。2012年3月之前任微软亚洲研究院视觉计算组主管研究员。研究领域包括:计算机视觉、图像处理、机器学习、模式识别和数值优化。担任IEEE TPAMI和IJCV编委,CVPR 2014/2016、ICCV 2015、NIPS 2015领域主席,AAAI 2016/2017和IJCAI 2016的高级程序委员会委员。2016年当选国际模式识别学会会士(IAPR Fellow)。详见个人主页:http://www.cis.pku.edu.cn/faculty/vision/zlin/zlin.htm

 

委员好消息   专委秘书处 刘海波、余志文 撰稿

 

  • 2016年8月18日和10月21日,国家自然科学基金委分别公布了2016年“优青”和“杰青”评审结果。北京大学林宙辰教授获“杰青”资助。CCF-CV专委会另有10位委员获“优青”资助:中国科学技术大学查正军、西安电子科技大学董伟生、清华大学冯建江、东南大学耿新、中科院自动化所赫然、复旦大学姜育刚、中山大学林倞、西安交大孙剑、同济大学王瀚漓和杭州电子科技大学俞俊。
  • 2016年10月12日,西安交通大学钟德星副教授的团队在广东“众创杯”创业创新大赛总结暨项目展示会上获得科技(海归)人员领航赛(团队组)金奖。大赛是全国“双创”活动周广东省级活动之一,该活动共有近2万个项目参赛,最终决出金奖项目19个。
  • 2016年11月5日,复旦大学姜育  刚教授团队在首届“网络舆情(音视频)分析技术邀请赛”特定视频识别项目中取得第一名,荣获金奖。大赛共收到来自全国各地的141支队伍报名,经组委会审 核,正式邀请32支队伍参加了现场比拼。
  • 2016年11月11日,复旦大学姜育刚教授入选2016年上海市青年拔尖人才,这是上海市委组织部、市人力资源社会保障局和团市委拟重点培养开发的第2批上海市青年拔尖人才。
  • 2016年11月14日,美国NIST公布了2016年TRECVID结果,北京大学彭宇新教授团队在视频搜索比赛的全部2项评测(计算机自动搜索和交互式搜索)中,均获得第一名,北京邮电大学苏菲教授团队在多媒体事件检测和监控事件检测比赛中均获得第一名。TRECVID是由NIST于2001年发起的视频信息检索领域的国际权威测评,每年一次,2016年共30支队伍参赛。北邮多媒体通信与模式识别实验室自2007年开始连续10年参加该评测,并在多个任务中取得突出成绩。北大彭宇新团队自2009年连续多年参加TRECVID并获得多项第一名。
  • 2016年11月21日,西安交通大学薛建儒教授荣获中国自动化学会青年科学家奖。第二届中国自动化学会青年科学家奖评审工作于2016年11月12日结束。经专家评审委员会评审,共有七位获得第二届中国自动化学会青年科学家奖。
  • 2016年11月获悉,中科院自动化所董晶副研究员再次入选IEEE亚太区执行委员会,同时担任该地区WIE (Women in Engineering)协调员。IEEE亚太区执行委员会负责亚太区国际学术交流、会员发展、奖励资助等各项组织工作。在本届执委会中,董晶是中国大陆的唯一执委,也是历年担任此职位的最年轻的中国女性。
  • 2016年12月4日,在第23届国际模式识别大会上,中科院计算所陈熙霖研究员和北京大学林宙辰教授当选国际模式识别协会(IAPR)会士。IAPR是由世界各国模式识别方面的专家和团体组成的国际性学术组织,成立于1978年,是国际信息处理联合会(IFIP)成员,现有23个会员国。作为模式识别领域最权威的国际性学术组织之一,该协会会士每两年评选一次,当选率少于会员总数的25%。2016年全球共28人当选。
  • 2016年12月4日,在第23届国际模式识别大会上,深圳大学沈琳琳教授团队再次获得国际细胞图像识别算法大赛冠军,这是该团队继2013年参加该项比赛获得冠军以来,再一次摘得桂冠。本次比赛总共设单细胞识别、多细胞样本识别、细胞分裂检测以及细胞分割四个任务,深圳大学沈琳琳教授团队在四个任务上准确率都排名第一。
  • 2016年12月10日,CCF YOCSEF学术委员会(AC)会议在北京举行。CCF理事、现任YOCSEF副主席、西安电子科技大学苗启广教授当选为CCF YOCSEF(2017-2018)主席。苗启广自2012年起担任YOCSEF AC委员,曾任YOCSEF(2015-2016,2016-2017)副主席,分管分论坛工作,期间帮助和推动了桂林、长春、无锡分论坛的成立;曾担任YOCSEF西安(2009-2011)主席,组织承办了第一届CCF青年精英大会和首届中国计算机视觉大会(CCCV 2015)。
  • 2016年12月16日,在2016中国人工智能产业大会暨第六届吴文俊人工智能科学技术奖新闻发布会上,清华大学马惠敏副教授、中科院信工所张晓宇副研究员、复旦大学张文强副教授分别获得吴文俊人工智能科学技术创新奖一等奖、创新奖二等奖和进步奖二等奖。吴文俊人工智能科学技术奖被外界誉为“中国智能科技最高奖”,迄今已成功举办六届,先后授予72个单位、369名学者96个创新成果表彰奖励,2016年共评出成就奖1名、创新奖13名、进步奖14名。