华南理工大学余志文教授访谈录

 

 

2017年11月3日晚,专委秘书处在线采访了华南理工大学计算机科学与工程学院副院长、优秀青年学者余志文教授。

 

余老师好,感谢您百忙之中安排时间接受我们的访谈,让我们有机会分享您研究过程中的经验!

您在短短几年间就在机器学习、模式识别、多媒体方向上做出了令人瞩目的成绩,能否和大家分享一下您在科研道路中获得成功的经验?您有什么成功的秘诀吗?

说成功的话还不敢当,科研的道路是无止境的。科研的路也是没有捷径的,只有多阅读文献才能推动我们前进。但在科研的路上,更重要的还是我们持之以恒的决心,困难总是会有的,看了很多论文但是没idea、实验做了好几个月但是出不了好结果、论文投了好多次还是被拒等种种挫折相信很多人都会经历,关键在于我们怎样保持乐观的态度,屡败屡战,越挫越勇,通过不断的努力跳出这个瓶颈期。其次是研究的内容最好不要太分散,在前期投入研究的时候,如果这也想学、那也想学,最终的结局只会是各个方向都只懂一些表面的东西,真正要对算法做优化或提出新模型却无能为力。

您发表了多篇高水平论文并被多次引用,今年还荣获国家优秀青年科学基金,在您取得的这些成就中,哪些工作让您印象特别深刻?

应该是我发表第一篇论文的经历。当时刚刚开始在香港城市大学修读博士学位,想把自己的科研成果投到国际知名的学术期刊上。第一篇论文内容是模式识别相关的,给第一家期刊投过去后,不久就收到了拒绝信;再投第二家,还是被拒绝。屡次被拒,这在求学初期是一件很常见的事。你觉得自己辛苦多时获得的很好的研究成果,在很多经验丰富的学术前沿专家看来,其实并没有什么价值。但是对于我们这些上课考试一直都能获得好成绩的学生,一下子难以接受这样的打击。还好我当时的导师一直在鼓励我、支持我,让我摆脱了沮丧,最终坚持了下来。后来根据审稿意见对论文进行了大量的修改,终于在第三次投稿时被《IEEE Transactions on Multimedia》采纳。我想对于绝大部分的学生而言,这样的经过诸多波折最后才获得成功的经历,应该是科研道路上最令人难忘的,就像是开启迈向成功的第一步。

您曾主持、参与20多个科研项目,发表100多篇学术论文,其中包括27篇IEEE/ACM Transactions期刊长文,您能否分享一下您在撰写论文方面的一些经验?论文写作中需要注意些什么问题呢?

作为一个过来人,我可以跟大家分享下这方面的经验。对于很多没写过论文的学生来说,写论文的确是一件比较有挑战的事情,一开始我也写的不是很好,一段话即使自己认真琢磨了还是存在语法和逻辑错误,文章总体结构也欠清晰,后来经过导师的多番指点才逐步掌握写作技巧,在一次次的锻炼中理清了论文写作的思路。在论文写作中最重要的一点是主线清晰,要以读者的身份问自己:为什么文章要分成这几部分?每个部分有什么关联?当你有了答案之后,文章的结构就会清晰明了,逻辑通顺。其次很重要的一点就是要充分展现出自己的创新点,让别人知道你论文的贡献之处。在细节上,想要做到句子优美、用词精准,那就需要多阅读相关的文献,了解常用的专业术语以及描述方式。此外,实验要有说服力,怎样多方面展现自己算法的优点,让读者确信你的算法是有效的。做到这些后,审稿人就没理由拒绝你的稿件了。

作为CCF理事、杰出会员, IEEE、ACM高级会员和一些刊物的编委,能否结合一些印象比较深的亲身经历,谈谈您在评价一份稿件时看重的内容闪光点?

我觉得最重要的还是创新点,这篇文章所述的工作有没有新意,应该是审稿人最看重的。创新点是这个工作的“不同”,有创新点才意味着这个工作确实是你做的,是一个产出的成果。其次就是这个工作的motivation,你这个工作是基于什么开展的,可以解决目前哪些不足。从问题出发,找到解决问题的方案,才能体现这个工作的价值。最后就是理论和实验论证,特别是理论论证,严谨的理论论证是非常具有说服力的,而大量的实验论证则说明你对工作进行了验证和修正。

您在集成学习方面颇有成就,能为我们介绍一下这个领域,以及您当初为什么会选择此领域进行深入研究呢?

当初开始从事集成学习是因为看得出集成学习是机器学习里面的一匹黑马,而从目前集成学习在学术界、工业界上的表现也印证了这一点。简单借用“盲人摸象”的典故来描述集成学习:假如把一个待研究的大数据集比作一匹大象,我们用于对数据进行挖掘的学习模型就是一个摸象的盲人,一个盲人去摸象是难以感知大象的整体外观的,但如果同时有很多个盲人去摸象,再把感知的信息结合起来,那么,我们就能得出大象的全貌。围绕集成学习这一原理,我们团队提出把多个学习模型有机融合起来的方法,以及各种新的集成学习模型,从海量的数据中快速获取有用的信息。

您担任华南理工大学计算机学院的副院长,在学术研究之外还要进行学院管理,请问您是如何平衡行政与科研两方面的工作的?

我觉得我们作为科研工作者,应该具备一种认知,那就是不管其他工作再怎么忙,研究和教学的工作都不能放下。担任副院长后确实多了很多杂乱的行政工作,需要花费大量的时间,但这并不能成为自己懒惰的借口。作为一名学者,最根本的就是做学术研究,这是我们的使命。以前我比较喜欢和学生一起在实验室学习研究,但是现在因为要处理一些行政工作,不得不长期留在办公室。不过这也只是换了一个地方继续做科研,虽然氛围没有实验室好,但是相关的工作不能落下。只要不是出差,我都会让学生陆续来我办公室一起讨论研究课题,即使讨论过程中偶尔会有其他的学生或者老师带着学院的公务过来打断,但是不能因为怕被打断就不再进行科研探讨,这是削足适履的做法。看论文和一些专家的博客分享等也可以在一些碎片化的时间里完成,即使是出差路上的时间也可以利用,总之要时刻保证知识面停留在相关学术发展的最前沿。

能否介绍一下您现在的科研团队?

我每年大概会招4个左右的研究生,以及1个博士,所以目前团队的规模不算小。硕士生有十几个,博士有5个,平时的培养压力也比较大,需要花不小精力顾及每一位学生的培养。研究方向比较多样化,包括聚类、分类、半监督、集成学习、遗传算法、粒子群算法、自然语言处理、深度学习、强化学习、迁移学习等,一个细致的方向通常我只会安排一到两个学生,通过每周讨论会大家互相之间交流,使得大家了解到机器学习各个方面的技术,成为一个全能型的机器学习科研人员。

研究团队的组建和管理是研究工作顺利开展的基础,能不能分享下您在学生指导方面的心得?

在管理学生方面,我还需要不断的探索和改进。刚当导师时我才刚从学校里出来,觉得自己还有很多很好的想法没有实现,因此指导学生时总是抓得很紧,好像很迫切地希望把自己当时的想法灌输给他们,让他们来帮我实现,甚至考虑到我当初写论文时吃的暗亏,发表的论文绝大部分内容都由我自己一个人来写或者修改,这其实是不利于学生的科研发展的。几年后慢慢地我开始意识到这样的指导是不正确的,开始转变自己的心态。让学生自己去选择一个感兴趣的方向,然后我再从旁作指导,给他们一些合理的建议,又或者是我指定一个大的方向,让学生自己去探索具体应该做哪一个领域的内容,尽量让他们自己去解决问题,而不是过多干涉学生的想法。而且实践证明这样的学生发展会更好,能力上能更快的得到提升。

但是还是需要适时地给学生一些压力,我认为人在紧张的状态下更能够发挥自己全部的潜能。有些学生特别是硕士研究生,自律性不够,也没有太高的科研积极性,这些学生往往需要一些外部的压力才能更好地完成科研工作。

在科研成果显著的同时,在课堂教学方面您是否也有些独特的心得?

课堂教学的第一个问题就是教材的选用。有些老师为了减少备课时间,沿用以前的课件及教材。当这个领域的新知识出来后,平均得过三年左右才能出现在他们的课件当中,学生学到的老知识老技术,跟不上技术发展的潮流。作为教师应该不惜一切代价给学生授予最前沿的知识,及时更替教学材料,除了讲授课程内容,还应该根据学科的发展动态、前沿研究,补充相应的知识,将知名学者、著名期刊等全面而系统地介绍给学生,以培养学生的科研兴趣。对于研究生课程的教学则应更加严格,除了要求他们阅读课程相关的前沿技术论文,还应要求他们去分析论文中的不足、总结精辟之处、提出改进方法,有时间条件的应该要求学生撰写课程论文,论文中应有充分的实验,从而全面培养学生的科研能力。

您曾在香港城市大学修读博士学位,能否结合您自身的求学经历,谈谈香港与大陆在科研人才培养方面的异同?

我觉得香港的学术氛围比较好,有了环境的熏陶,学生就会不自觉地静下心来学习,向更高水平的研究者靠拢。我在城大读书的时候,每周导师都会主持两到三次的讨论会,大家轮流汇报一下最近的工作,让每个人都了解团队里的其他成员最近在做一些什么课题,可以进行相关的交流学习;另外还需要和大家分享一下最近看的一些论文,自己讲一遍可以梳理内容,对论文的理解更加深刻,同时听的同学也能以一个较快速的方式了解到学术前沿问题。而在国内老师们可能对讨论会就不是那么重视了,通常就是让一两个学生到办公室汇报一下工作,或者是老师去实验室看看学生最近做的一些工作,而不是一个公开的讨论平台。而且在国内做科研,感觉是外部诱惑比较多,大家很难安安静静地一心为科研,总是容易想着说今晚会有什么有趣的活动要参加,或者是周末要去哪里玩。相比之下我在香港学习的时候,大家都是在实验室学习到晚上九点多,一些像我这种英语底子不是很好,需要“勤能补拙”的学生会学习到十一二点,周末除了外出购买一些生活用品外,都会在实验室工作学习,日常除了运动基本就没有什么业余的活动。所以很多老师和学生都羡慕在香港做课题,成果产出率更高,往往能获得不少的成果。

您成功地把机器学习应用于模式识别、多媒体等应用方向,取得了良好的成果。请问您从事的工作是偏科研还是工程?

工程很多时候是对现有技术的合理利用,而科研是在技术层次的创新。要做高水平的学术,我还是把自己定位为科研人员而不是工程人员。我从事的基本都是基础理论研究工作,没有在研发产品方面投入精力。理论研究是整个科研体系的基石,只有把科研的一砖一瓦堆砌起来,才能促进产业界的进步,国家未来的长足发展才有足够的推动力。现在市场上很多先进又好用的软件,像Siri、天天P图,都是通过基础算法的研究而生产出来的。而我们,就是设计这些算法的人。

您在集成学习、聚类、半监督学习、多目标优化方面已经取得比较丰厚的成果,在未来几年里,您有想过开辟新的研究方向吗?

那肯定是有这样的想法的。特别是一些学生因为年轻,容易产生一些乍一眼看上去好像有点天马行空的想法,但是如果他愿意用心去做,我也会支持,而且确实有些学生的想法最后也有了一定的成果产出。前段时间我的合作导师IEEE Fellow陈俊龙教授(Philip Chen) 提出了一种叫做board learning的算法,是与最近非常热门的deep learning相对而提出的,我觉得这个想法就非常新颖,让团队里的每个学生都好好学习这种思想,如果可以,我们也尝试这个方向上能不能取得一些突破。

能否谈一谈人工智能未来几年您认为比较有前途的研究方向?

在未来几年里,媒体大数据依然会是人工智能的重中之重,所以我们一直把模式识别、多媒体作为研究重点之一。深度学习在近几年比较火,在处理媒体大数据中取得了很好的效果,虽然深度学习不是我们的研究重点,但我们也一直保持着对这个领域的关注。算法的可靠性、准确性与效率性一直是我们关注的重点,深度学习的准确性是大家认同的,但是它的效率性却一直被诟病。最近我的合作导师陈俊龙教授提出的board learning很好地解决了深度学习效率性的问题,通过网络的平铺,进行更丰富的特征提取,仅通过很浅的网络就能达到深度学习所能达到的准确性,这使得board learning省去了漫长的训练时间,是一种既高效又准确的算法。随着board learning理论的完善,我相信在未来几年里,会有很大的发展。

您对目前的工作成果是否满意,有没给自己设定一些发展目标呢?

我觉得还是不要谈目标吧,因为我自己本身是挺享受学术研究这个过程的。对于我带的一些没有太大科研动力的研究生,我可能会给他们定一些小目标来敦促他们,但是像我们这种对科研感兴趣的人,谈目标感觉就太功利了一些,很有可能把兴趣变成了完完全全的任务,能动性反倒是大大地降低了。我觉得华南理工大学是一个很不错的平台,它能帮我申请到科研的经费,在经费上不需要太多的担忧,可以不受外界干扰地,踏踏实实地做科研,做些感兴趣的,有意义的研究。

很多人眼里,余老师您是一位非常勤奋的研究者,请问在生活中余老师是什么样的一个人呢?能否跟大家分享一下您生活的其他方面?

在生活方面我是一个比较easy going的人,尤其是在跟学生相处方面。平时在办公室、讲台上可能看到我是一个比较认真严肃的人,但是在工作之余我从来都是放下教师架子,跟学生打成一片。以前行政事务没那么繁忙的时候,经常会跟学生一起去打羽毛球娱乐一下,周末也会跟家人一起去户外活动,增进感情。我觉得在生活中张弛有度对做好科研大有裨益。

您一般每周工作多长时间?您是如何平衡科研与日常生活的? 

在时间管理上我也没什么心得,反正就是有空余时间就工作,我很享受工作的过程。最近这两年和香港城市大学合作申请了一个项目,经常需要出差到香港交流,花在路上的时间特别长,有些还难以利用,而且有时还需要利用自己周末甚至是寒假的时间。所以其实我也没有很好地区分学校的科研与家庭的日常生活,只能说该做哪一件事的时候就要专注地做好。在学校就要认真地和学生一起学习讨论,出差参加研讨会和各种会议时也要抓紧机会多接收一些新的知识和想法,提高科研效率。在保证科研成果产出的情况下尽量腾出一些时间来陪伴家人,和家人外出旅游,郊外踏青,碰上节日假期回老家陪陪父母。

对于现在的硕士生来说,毕业之后是继续走学术道路好还是离校找工作好呢?现在有很多研究生觉得很迷茫,您对在读的研究生有哪些建议?

这个问题主要看学生自己的意向。有的同学动手能力比较强,倾向于工程实现,那么毕业之后去企业工作对自己会比较有帮助;而有的同学则对科研比较感兴趣,看文献时有独到的理解,这些同学更适合走学术的道路。我们作为导师应该尊重学生的意愿,让学生得到最大程度的发展。但对于那些没有明显倾向的同学,我个人建议,如果自身对科研是有点兴趣的,或者自己在这方面有一定潜力的,都应该尝试一下继续走学术的道路,给自己定高一点的目标,做高水平的学术,为工业界贡献更多高效准确的算法,推动社会科学的发展。

您在机器学习方面取得了很多成果,能为刚入门的年轻学者提供一点建议吗?

我觉得开展科研工作的初期,最重要的是给自己选定一个合适的方向。因为在刚开始做科研的时候,往往会碰上很多失败,只有自己选定了一个方向,才能很好地坚持下去。刚开始入门时要多读一些相关的论文,了解经典的算法以加深对问题的理解,同时了解这个学科方向的发展前沿工作。科研方向做得比较窄,保持对一个方向深入的思考,才比较容易做出成果来。当你对这个问题有了更深刻的认识,才可能得到一些创新的点子,才能做出有价值的成果。

余志文,华南理工大学计算机学院教授、博士生导师、副院长、国家优秀青年科学基金获得者,CCF理事、CCF杰出会员、ACM广州分会副主席、CCF广州分部执行委员、2015-2016 CCF YOCSEF广州主席、IEEE、ACM高级会员, CCF人工智能与模式识别专委会委员、CCF计算机视觉专委会委员、CAAI机器学习专委会委员。于2008年在香港城市大学计算机系获博士学位,之后在香港理工大学电子计算系做过博士后研究,2011年入选教育部新世纪优秀人才支持计划, 2013年获得广东省自然科学杰出青年基金资助, 2017年获国家优秀青年科学基金资助。主要从事机器学习、数据挖掘、模式识别和人工智能方面的研究,发表学术论文近100多篇,其中27篇IEEE/ACM Transactions系列论文,如:TKDE, TEC, TCYB, TMM, TCSVT, TCBB, TNB等,1篇论文获国际会议最佳论文奖,担任CCF会刊《计算机应用》编委。主持和参与的项目20多项,其中主持国家、省部级项目11项。更多信息见个人主页:www.hgml.cn/yuzhiwen

(责任编辑:韩爱丽 余烨)

委员好消息

  • 2017年9月18日,CCF-CV专委会委员、中科院自动化所副研究员、银河水滴科技创始人兼首席执行官黄永祯博士入选2017年《财富》中国40位40岁以下的商界精英。黄永祯毕业于中科院自动化所模式识别国家重点实验室,师从著名计算机视觉专家谭铁牛院士。其自主研发产品已经被广泛用于安防反恐、机器人、智能家居、智能商业等领域。
  • 2017年9月21日,北京市科委发布了2018年首都科技领军人才培养工程和北京市科技新星计划入选人员名单。CCF-CV专委会秘书长、中科院自动化所王亮研究员入选首都科技领军人才培养工程,CCF-CV专委会委员、北京航空航天大学李甲副教授入选北京市科技新星计划。2018年度首都科技领军人才培养工程入选人员共30人,科技新星计划共120人入选。
  • 2017年10月1-4日,在美国丹佛举办的IJCB 2017上,CCF-CV专委会委员、清华大学冯建江副教授、鲁继文副教授和清华大学深圳研究生院郭振华副研究员指导的论文Fingerprint Pose Estimation Based on Faster R-CNN获最佳学生论文提名。
  • 2017年10月12日,CCCV2017最佳论文获奖名单出炉。CCF-CV专委会副主任、北京大学査红彬教授指导的论文Structure-aware SLAM with Planes in Man-Made Environment获最佳论文,CCF-CV专委会委员、中山大学朱俊勇副研究员、赖剑煌教授(专委会副主任)和谢晓华研究员指导的论文Person Re-identification on Heterogeneous Camera Network获最佳学生论文。CCF-CV专委会委员、南京信息工程大学刘青山教授(专委会常委)和袁晓彤教授指导的论文Hyperspectral Image Classication Using Spectral-Spatial LSTMs获最佳学生论文提名。会议共收到有效投稿465篇,录用187篇,评出最佳论文、最佳学生论文、最佳论文提名和最佳学生论文提名各1篇。
  • 2017年10月12日,2017年度CCF-CV颁奖典礼在天津举行,CCF-CV专委会委员、中国民航大学杨金锋教授、南开大学程明明教授和CCF-CV专委会副秘书长、湖南大学李实英副教授荣获本年度CCF-CV服务贡献奖。
  • 2017年10月14日,CCCV 2017竞赛结果揭晓。在心血管OCT易损斑块识别技术挑战赛(中科院西安光机所、北京健康促进会心血管影像中心承办)中,CCF-CV专委会委员、东北大学贾同教授,清华大学深圳研究生院郭振华副研究员指导的队伍分别获得三等奖。在遥感图像目标提取技术挑战赛(北京航天宏图承办)中,CCF-CV专委会委员、哈尔滨工业大学深圳研究生院徐勇教授指导的HGC队获得冠军,CCF-CV专委会委员、中科院自动化研究所樊彬副研究员指导的blueskyforever队获得季军。
  • 2017年10月23日,在ICCV 2017的HANDS Workshop上,CCF-CV专委会委员、华南理工大学金连文教授等指导的论文YOLSE: Egocentric Fingertip Detection from Single RGB Images获得最佳论文奖。
  • 2017年10月23-27日,在美国加州山景城举办的ACMMM 2017大会上,CCF-CV专委会委员、中国人民大学金琴副教授在MSR Video to Language Challenge(MSR-VTT)竞赛中卫冕冠军,金琴团队是在去年举行的第一届MSR-VTT夺得冠军后,今年再度取得了主观人工评测和客观性能评测的双冠军。团队发表的论文“Knowing yourself: improving video caption via in-depth recap”也获得了挑战赛最佳论文奖。此外,在大会第一天的AVEC 2017(Audio/Visual Emotion Challenge and Workshop)中也夺得了Affect Sub-Challenge的冠军。
  • 2017年10月26日,CCF-CV专委会委员、中科院自动化所副研究员黄永祯博士作为创始人兼首席执行官的银河水滴科技入选清科2017年度中国最具投资价值企业50强(2017 Venture 50 -新芽榜50强)。银河水滴科技是专注于机器视觉和人工智能的高科技创新型公司,开发的基于步态的身份识别系统突破传统生物特征识别近距离、需配合的局限,将成就身份识别领域的终极形态。
  • 2017年10月27日,CNCC 2017大会举行颁奖,CCF-CV专委会副主任、爱奇艺首席科学家王涛领导的爱奇艺技术团队研发的“HCDN——大规模混合架构在线视频数据分发技术”、“视频情感识别及其大规模应用”分别斩获本届大会CCF技术发明二等奖、CCF科技进步优秀奖。
  • 2017年10月28-29日,在CCBR 2017上,CCF-CV专委会委员、中科院自动化所雷震副研究员指导的论文Detecting Face with Densely Connected Face Proposal Network获得最佳学生论文一等奖。CCF-CV专委会委员、北京航空航天大学黄迪副教授指导的论文2D-3D Heterogeneous Face Recognition Based on Deep Canonical Correlation Analysis获得最佳学生论文二等奖。
  • 2017年10月29日,ICCV2017公布了 Joint COCO and Places Recognition Challenge 竞赛排名情况,CCF-CV专委会委员、中科院自动化所刘静研究员带领的团队在Places场景解析挑战任务中,击败谷歌、今日头条、亚马逊、牛津大学、清华大学等国内外著名AI实验室以及知名科研院校,获得最终冠军。
  • 2017年10月29日,CCF-CV专委会委员、旷视科技首席科学家、研究院院长孙剑带领的旷视科技研究院团队获得了 2017 COCO & Places 图像识别大赛三项冠军(COCO 物体检测和人体关键点,Places物体分割),成为了第一个在 COCO 竞赛中获得冠军的中国企业。2017年10月31日,旷视科技完成6亿美元C轮融资,此融资金额刷新了人工智能领域融资记录。旷视科技成立于2011年,主要从事计算机视觉相关技术研发与应用落地,最早以“Face++”的名字为外界熟知。
  • 2017年11月2日获悉,CCF-CV专委会秘书长、中科院自动化所王亮研究员在研究生培养工作中成绩卓越(所培养的研究生黄岩博士荣获中国科学院院长特别奖),获得了中国科学院优秀导师奖。
  • 2017年11月2日获悉,CCF-CV专委会委员、中科院自动化所助理研究员黄岩博士荣获中国科学院院长特别奖,中科院共计40位优秀青年研究人员获此殊荣。黄岩曾获得CVPR-Workshop最佳论文奖、ICPR最佳学生论文奖以及RACV最佳墙报奖等学术奖项;曾获得博士生国家奖学金、攀登一等奖学金、百度奖学金、北京市优秀毕业生等荣誉奖励。
  • 2017年11月3日获悉,人力资源社会保障部公布了2017年国家百千万人才工程入选人员名单。共411人入选,授予“有突出贡献中青年专家”荣誉称号,CCF-CV专委会委员、中科院自动化所副所长刘成林研究员、CCF-CV专委会常务委员、中科院计算所山世光研究员入选。

(责任编辑:刘海波 余志文)