同济大学王瀚漓教授访谈录

2017年4月27日,委员风采版块编委采访了同济大学电子与信息工程学院计算机科学与技术系教授、国家自然科学基金优秀青年基金获得者、博士生导师王瀚漓教授。采访内容摘录如下:

问:王教授,您在图像处理与计算机视觉领域进行了很多高水平研究工作,获得了国家自然科学基金优秀青年基金,入选了教育部新世纪优秀人才支持计划,是青年科技工作者的楷模。您能否向大家分享一下您的科研经历、主要科研成果和成功经验?

答:首先感谢CCF计算机视觉专委简报的采访。作为学术界的晚辈,我非常荣幸能在此与大家进行交流。在研究工作方面,我还需要向国内外的各位前辈和同行多多学习和请教。

关于自己的学习和科研经历,我的感觉是一直都很幸运。我在浙江大学攻读学士学位,后来获得保送资格继续攻读硕士学位。研二时,我的硕士导师推荐我尝试申请香港城市大学的一份研究助理工作。经过一些准备,我比较顺利地获得了这一职位。当时合作指导的导师是Sam Kwong教授和金耀初教授,主要从事的研究课题是模糊系统的可解释性规则及其应用。这样,我攻读硕士学位的最后一年是在香港城市大学度过的,我很感谢Sam和金老师的指导,带我进入高水平的科研学术殿堂。在两位导师的指导下,我比较顺利地完成了这个研究课题的既定任务。硕士毕业后,我选择了继续在香港城市大学攻读博士学位,研究方向选择了视频编码和多媒体信号处理。选择这一研究方向一方面是出于课题组的实际需求,另一方面是我个人也希望做一些和实际应用更紧密相关的课题。在三年的博士求学阶段,我很感激导师Sam的悉心指导,从导师Sam那里我不仅获取了开展科研的能力,而且也培养了自己的心性。导师Sam的那种达观、宽容和平和的心态值得我永远学习。临近博士毕业前夕,我申请了德国的洪堡学者奖学金。在等待期间,Sam为我提供了香港城市大学研究员的职位,使我可以继续安心从事科研工作。我作为研究员在香港城市大学工作1个月后,一位好友向我推荐了斯坦福大学访学和在硅谷初创公司工作的机会。在征求Sam的同意后,我前往美国加州开始了长达约1年半的访学工作,师从Charles K. Chui教授,主要从事视频编码和传输的研发及应用。美国的访学工作结束后,我来到了德国,开始了德国的洪堡学者研究工作,主要从事视频编码优化理论等方面的研究,师从Wolfgang A. Halang教授。2010年5月,我回到了上海,加入同济大学计算机科学与技术系,现为教授、博士生导师。

自2004年至今,我的主要研究方向之一是视频编码,主要包括:视频的快速编码理论与方法、码率控制等。回国之后,由于团队的扩大,我也开始尝试计算机视觉和机器学习方面的研究工作,包括:图片/视频检索、多媒体事件检测等。回首这十多年来的科研工作,我庆幸自己非常幸运。一路走来,得到了诸位恩师、前辈和朋友的帮助,自己也比较自律和努力,取得了一定的成绩。

问:您在IEEE Transactions on Image Processing等国际顶级期刊和会议上发表学术论文 100 余篇,并入选爱思唯尔(Elsevier)“中国高被引学者”。您在取得这些科研成果的过程中有哪些不为人知的艰辛过程或有趣经历?您认为优秀科研人员最重要的品质是什么?

答:现在回想起来,很多事情和经历都非常难忘。在这当中,我特别珍惜两个时期的经历。

第一时期是2003-2007年,我在香港城市大学求学和工作。初次来到香港是2003年3月,当时正值SARS肆虐,记得那时每天都带着口罩,即便在办公室里也带着口罩。当时,经济不景气,房租也便宜,初来香港在深水埗找了间唐楼,10楼的一个小隔间,大约7-8个平方,没有电梯,一个上下铺,一个独立洗手间。我一住就是4年,室友换了很多,都是香港城市大学计算机科学与技术系的学生或访问学者。那段时间,我基本都是每天早上6点起床,步行到办公室,途中买个菠萝包或红豆沙包,就着白开水,就是早餐。晚上大约11点和室友及办公室的小伙伴们一起搭伴返回住处。每天过着三点一线的生活:“住处-办公室-食堂”。生活貌似枯燥,但却非常充实。那段时光现在回想起来,是我最珍视的经历之一,我不仅可以全身心地投入科研,而且也收获了诸多珍贵的友谊、结识了很多好朋友。

第二段经历是2007-2009年,我在美国访学、工作。刚到美国时,正值美国次贷危机爆发之时。导师Charles和同事们在生活方面给予我无微不至的关怀和照顾,至今回想起来亦倍感温暖。当时一起合作的有三名研发工程师,我主要负责算法方面的设计和核心模块的原型编程。我们四个人在一间办公室里,经常讨论可能的技术方案,偶尔还有休息时段的最新当地轶闻和趣事,繁忙中夹杂着欢乐。从他们身上我看到和学到了很多东西,包括技术、积极乐观、沟通和协作。当时的办公室靠近Menlo Park,我住在旁边的一个城市Redwood City,很多清晨我都步行前往办公室,行走于两个城市之间,路过稀疏错落的墨西哥小店,感觉很惬意。

关于科研人员的重要品质,我觉得首先对科研要有激情,对所从事的研究领域要热爱和怀有浓厚的兴趣。其次,要有持之以恒的毅力和定力,做科研要耐得住寂寞。科研过程中,遇到困难和挫折时不要气馁,要善于总结经验教训,及时调整思路和方法。

问:高效的科研团队对于深入开展课题研究有至关重要的作用。您作为同济大学多媒体与智能计算实验室主任,您能否简要介绍一下您的科研团队?您认为怎样才能组建和管理一个高效的科研团队?

答:我于2010年7月加入同济大学,在学院和系里的支持下,分配了一间实验室,于2011年开始招收研究生,并成立了有关多媒体与智能计算方面的实验室。迄今为止,已经毕业了12名研究生,目前实验室在读的博士研究生有9名,硕士研究生有10名。我们课题组规模还比较小,称不上是一个高效的科研团队。在这里,我也打个小广告:从事多媒体、计算机视觉和机器学习等方面研究工作的朋友和同仁,如果您或者您的朋友希望加入同济大学计算机科学与技术系,欢迎联系我。

问:作为博士生导师,您在招收研究生时最注重学生的哪些方面?能否分享一下您在指导研究生方面的心得体会?

答:在招收研究生时,我主要注重学生以下几个方面。首先是学生的入学动机,我比较偏爱对科研真正感兴趣的学生。兴趣是最好的老师,一个真正对科研感兴趣的学生,才能在学术研究的道路上走得更远并享受科研工作带来的乐趣。我还看重学生的品格,我欣赏踏实、勤奋、做事认真细致的学生。此外,我比较重视学生的相关科研基础、数学功底和英语水平。每年招收学生前,我都会和候选学生聊一聊,说一下我的培养方式和对学生的期待,也听听候选学生的想法,考察他们在科研兴趣、品性和相关基础方面的情况。虽然一两次谈话并不能真正了解一个人,招收前的沟通还是或多或少可以起到一定作用。

正如前面所讲,我们课题组目前有约20名研究生。我每周都会花1到2天的时间和每个学生进行单独讨论(或小范围研讨)。通过和每个学生进行单独交流,了解他们的科研进展和近期计划,并给予相应的指导。在与学生的谈话过程中,除了交流科研,时常也会关心他们的生活,希望可以和学生做到亦师亦友。

问:科研基金是开展科研工作的前提。您申请科研基金通常从哪些方面进行准备?您认为书写基金申请书时应注意哪些问题?能否分享一下您个人申请科研基金的成功经验或失败原因?

答:是的,对于科研工作者来说,科研基金是非常重要的,可以看成是开展科研工作的前提。在同济大学计算机系,招收研究生的指标直接和科研经费到款挂钩。科研经费到款少,意味着招收研究生的指标少甚至停招。关于科研基金的申请,我个人觉得一定要做好调研和先期准备工作,要根据自己的实际情况看适合申请哪类科研基金,申请科研基金时要注意是否有相关的科研基础和积累。

关于基金申请书的准备,首先要有一个立意鲜明的题目,做到主题突出。其次要做好国内外相关研究现状的调研工作,分析应该全面、客观,突出申请工作与已有工作的不同之处。申请书要重点介绍申报工作的研究目标、研究内容和具体研究方案,目标、内容和方案之间要相辅相成、环环相扣。此外,要凝练好申请工作的创新点,有理有据地阐述申请工作的可行性以及研究团队已有的相关研究基础。申请书写好后,建议给领域内有经验的专家看看,请专家提提意见,再有针对性地修改。

我第一次写基金申请书时,是申请香港的RGC项目,一开始没什么经验,写好后同导师和其他合作者讨论,反复修改多次。后来再写就好些了。我的相关经验也不多,倒是有幸看过一些非常优秀的申请书,感觉好的科研基金申请书是一定要经过千锤百炼的。

问:您能否结合自己的审稿经历,谈一下学术论文写作需要注意哪些方面的问题?您对于研究生撰写学术论文和投稿有哪些建议?

答:在学术论文写作方面,我个人觉得可以考虑以下几个方面:(1)主题明确,立意鲜明。一篇好的学术论文应该具有明确的主题和相关背景介绍,其提出的方法或解决问题的途径与本领域其他相似或相关方法相比应该具有良好的创新特色。(2)层次清楚,脉络分明。在论文的谋篇布局方面应该具有较好的逻辑性。例如,在介绍一个新的算法时,可以描述出:他人方法及其局限性(或可以提高的方面),设计本文方法的动机、目标及具体方案,本文方法所提方案的验证(包括所提出的每个创新点的验证)。(3)语言精炼,表达顺畅。文章的遣词造句要仔细斟酌和推敲。一篇好的论文一般要修改多次才能完成。

对于研究生朋友们,我建议要多读、多写和多悟。多读一些本领域顶级期刊和会议论文,培养自己的语感。要擅于将自己的阶段性成果和心得进行记录,落到字面,平时注意培养自己的写作能力。读论文时要多思考、多领悟,有意识地提高自己的逻辑思维能力。关于投稿,建议要多听取导师的建议,做好规划,并勇于大胆尝试。即使被拒,也不要气馁,可以从审稿人的意见中学到很多有益的东西并从中得到启发。

问:您认为计算机视觉领域未来比较有潜力的研究方向主要有哪些?您能否对计算机视觉领域入门者给出一些建议?

答:实际上,我真正开始计算机视觉方面的研究工作起步较晚,大约是从2012年初开始的,我就结合我目前研究团队在计算机视觉方面拟开展的研究工作说一下吧。目前,我们团队的研究方向之一是可感知视频编码,希望更好地从人类视觉的感知角度对视频数据进行压缩,同时我们也希望借助于计算机视觉技术对大规模视频数据进行协同编码。另一个研究小组在从事图片/视频描述方面的相关研究工作,通过对图片/视频的内容理解,生成相应的描述。此外,我们也尝试在视觉问答方面做一些探索工作。我个人认为通过借助于视觉信息的理解进行预测学习,应该是一个很有潜力的研究方向。

问:您既是一位成功的科研人员,又是两个孩子的慈父,拥有幸福的家庭。请问您是如何平衡科研工作和日常生活的?

答:在家庭方面我觉得自己很幸运,大女儿今年升初中,小儿子刚刚学会走路。面对一双儿女有时觉得很愧疚,我住在浦东张江,工作在同济大学嘉定校区,一个在上海的东南角,一个在上海的西北角,路上单程耗时2小时左右,我很多时候是周一到嘉定校区,在学校工作到周五才回家,家人也表示理解和支持。周末在家,我会努力陪伴孩子们,或者陪着去上兴趣辅导班,或者一起做游戏。

问:大家都知道,科研工作是非常辛苦、需要全身心投入的。健康的体魄是科研工作的必要保证。请问您是怎样平衡工作与休息的?您平时主要进行哪些体育锻炼?能否与大家分享一下您的业余生活?

答:我的作息时间比较有规律,大约从大学时代就养成了规律作息的习惯。工作日基本上每天晚上12点睡觉,早上6点起床,中午会午休30~60分钟。太忙时可能会稍微再晚睡一些,但是我会及时进行调整,避免自己过于疲劳。

平时我很喜欢走路。说来惭愧,我到今天还没有去学开车,每个学期开始时总是和自己说,下个学期一定要去学,等到了下个学期又有其他事情和安排,就又拖到后面了。因此,我经常走路。此外,我非常喜欢游泳,周末或放假有空时会去游泳。平常空闲时间不太多时,也会督促自己做些小的体育锻炼,比如伏地挺身和高抬腿等不太花时间的运动,每次10分钟左右,一天做2-3次。

我的业余生活挺单调的。在学校工作时,基本上就是三点一线的工作和生活模式;周末回到家,除了工作外,就是陪孩子们、帮家人做家务。有时候,晚上吃得比较多、较难消化时,也会唱唱歌,一来锻炼自己的肺活量,二来健身效果还是不错的,各位朋友有兴趣可以试一试J。

王瀚漓,男,博士、教授、博士生导师。分别于2001年和2004年于浙江大学电气工程学院获工学学士和工学硕士学位;2007年于香港城市大学计算机系获哲学博士学位,并荣获香港城市大学杰出毕业论文奖。2007年至2008年于香港城市大学从事研究员工作,同期访问美国斯坦福大学从事访学工作。2008年至2009年于美国加州硅谷公司Precoad Inc.担任软件工程师。2009年至2010年于德国哈根综合大学从事德国洪堡学者研究员工作。2010年回国,现任同济大学计算机系教授、博士生导师。主要研究领域包括视频编码、计算机视觉和机器学习等。发表学术论文100余篇,2014-2016年连续三年入选爱思唯尔(Elsevier)“中国高被引学者榜单”,并获得了包括教育部新世纪优秀人才支持计划、上海市浦江人才计划、上海市曙光学者计划、上海高校特聘教授(东方学者)计划及其跟踪计划、国家自然科学基金优秀青年科学基金等人才类计划项目。主要学术兼职包括IEEE高级会员、德国洪堡基金会会员、中国计算机学会高级会员、中国计算机学会多媒体专委委员、中国计算机学会计算机视觉专委委员、中国电子学会会员、上海市计算机学会多媒体专委会副主任、上海市计算机学会人工智能专委会副主任等,担任多个国际学术会议的分会主席和程序委员会委员。

(责任编辑:韩爱丽 余烨)

委员好消息

  • 2016年8月21日,由第23届国际模式识别大会组织的2016ChaLearn LAP大规模手势识别竞赛中,CCF-CV专委会委员、中科院计算所陈熙霖研究员团队获得在线动态组冠军,西安电子科技大学苗启广教授课题组荣获静态组冠军,公安部三所梅林主任与西安电子科技大学软件学院沈沛意教授联合团队荣获季军。ChaLearn LAP国际手势识别竞赛从2011年至今已经连续举办五届,被誉为模式识别和机器视觉领域最富挑战性的战场,本届大赛吸引了全球各大高校和科研机构的53支参赛队伍。
  • 2017年3月,IEEE ICME2017评出World’s FIRST 10K Best Paper Award,CCF-CV专委会委员、中山大学人机物智能融合实验室林倞教授的论文 “Knowledge-Guided Recurrent Neural Network Learning for Task-oriented Action Prediction” 荣登榜首,获钻石奖。IEEE ICME是国际多媒体领域旗舰会议之一,World’s FIRST 10K Best Paper Award是由IEEE ICME组织评议的奖项,以促进通用多媒体相关领域的研究进展,由相关领域的世界顶尖研究人员组成的评奖委员会对决赛作出独立评议。
  • 2017年4月1日,据教育部新闻办公室官方微博消息,经学校推荐、通讯评审、会议答辩、人选公示、评审委员会审定、聘任合同签订等程序,教育部最终确定440人为2016年度长江学者特聘教授、讲座教授、青年学者。CCF-CV专委会委员、上海交通大学熊红凯教授入选长江学者特聘教授,CCF-CV专委会委员、西安电子科技大学董伟生教授入选青年学者。
  • 2017年4月23日,VALSE 2017在厦门落下帷幕。VALSE 2017新增了年度贡献奖(评出8人)、年度优秀WEBINAR讲者(评出10人)和最受关注Poster奖(评出一、二、三等奖各1、2、3篇)。CCF-CV专委会委员、中科院自动化所何晖光研究员、合肥工业大学贾伟副研究员、电子科技大学姬艳丽副教授、国防科技大学郭裕兰老师获VALSE2016-2017年度贡献奖,CCF-CV专委会委员、中科院深圳先进技术研究院乔宇研究员获VALSE 2016-2017年度优秀WEBINAR讲者,CCF-CV专委会常务委员、华中科技大学白翔教授的CVPR 2017论文“Detecting Oriented Text in Natural Images by Linking Segments”获VALSE 2017最受关注Poster奖一等奖,另有多位CCF-CV专委会委员论文分别获得二、三等奖。VALSE发起于2011年,是国内计算机视觉、图像处理、模式识别与机器学习领域青年学者的学术交流舞台。
  • 2017年4月26日,2016年度北京市科学技术奖励大会上,由CCF-CV专委会委员、北京大学彭宇新教授等完成的“互联网多模态内容分析与识别关键技术及应用”项目荣获北京市科学技术奖技术发明类一等奖。该项目发表论文100多篇(其中ACM/IEEE Trans.期刊和CCF A类论文26篇),获发明专利授权50项,软件著作权16项,6次参加国际权威评测TRECVID和TREC,每次均获得第一名。该项目形成了互联网多模态内容分析与监管系统等系列产品,直接经济效益3亿元,并在维护我国互联网内容安全、促进网络文化健康发展等方面产生了显著的社会效益。
  • 2017年5月5日,中国图象图形学学会视觉大数据专委会(CSIG-BVD)成立,CCF-CV专委会秘书长、中科院自动化所王亮研究员当选为CSIG-BVD专委会主任,CCF-CV专委会委员、西安交大薛建儒教授,上海交大熊红凯教授和东南大学耿新教授当选副主任,中科院自动化所赫然研究员当选秘书长,复旦大学姜育刚教授、中山大学郑伟诗教授、中科院信工所张晓宇副研究员当选副秘书长。
  • 2017年5月6日,CCF-CV 专委会委员、中科院自动化所何晖光研究员团队的工作 “Sharing Deep Generative Representation for Perceived Image Reconstruction from Human Brain Activity”被MIT Technology Reivew 头条报道评述,该工作可以通过大脑扫描数据重建图像,“新提出的技术有效克服了这个领域的一系列难点,能够更加精确地读懂人类大脑信号,还原出人眼所看到的视觉场景。该技术不仅对计算神经科学意义重大,也是研发新一代脑-机接口技术的基石。“

(责任编辑:刘海波 余志文)