东南大学耿新教授访谈

2017年7月8日,CCF-CV专委会简报委员风采栏目编委采访了东南大学计算机科学与工程学院耿新教授。下面是采访实录。

耿老师好,与您初次相识还是3年前的那个春天,如今,您又取得了累累硕果,特别是获评国家“优青”,这是多少青年学者梦寐以求的事情。您能结合自身的经历,给大家分享一下摘下“优青”桂冠的经验吗?

其实每个评上“优青”的青年学者都有各自的研究特色,如果说有什么经验的话,就是青年学者要尽快形成自己的“标签”,也就是别人一提到你的名字就能想起你是做什么的。有了这个标签,申请的时候自然就会围绕这个标签,很容易突出特色,让人眼前一亮,而不会泯然众人。

做科研选择一个好的方向很重要。您目前的研究兴趣主要集中在哪些方向?能讲讲您是怎么选择研究方向的吗?

目前我的研究兴趣主要集中于一种新型机器学习范式,叫做“标记分布学习”。这种学习范式源于我们以前为了解决一个实际应用问题而提出的一个算法,后来经过一系列的扩展和泛化逐渐形成现在的机器学习框架。这是一个典型的应用驱动、理论升级的过程,这个过程中自然就选定了研究方向。

此前我们了解到,您做的机器学习主要用于解决人类属性识别问题,我们知道,对人类属性进行识别是机器感知人的主要途径之一,“机器对人的感知”一直以来都是计算机科学领域一个重要的研究课题,而您从事的基于机器学习的人类属性识别,主要是感知和识别人类的哪些属性?都有哪些应用领域?能给我们讲讲这个领域的故事吗?

这个领域最为大家所熟知的研究也许就是人脸识别,另外,性别、表情、年龄、姿态、手势等属性的识别也是比较常见的研究。机器对人的感知在人机交互、安防监控、推荐系统等领域具有广泛的应用。我们开发的一个年龄估计系统曾被应用于诺贝尔生理学或医学奖得主Elizabeth Blackburn教授领导的实验室关于端粒与年龄关系的研究中。

国内外许多重大研究计划中对此都有所布局。例如,2016年国家重点研发计划“云计算和大数据”专项指南中确定的四个技术方向之一为“云端融合的感知认知与人机交互”;《国家中长期科学和技术发展规划纲要》中,信息技术领域重点安排的三个前沿方向包括“以人为中心”的智能感知技术;2015年美国国防部高级研究计划局 (DARPA) 启动的“X班组核心技术”项目的核心内容之一为“了解士兵和作战状况的感知技术”,等等。

您是国际上较早从事人脸年龄估计研究的研究者之一,不仅在学术圈中有一定影响力,我们还在英国广播公司(BBC)和澳大利亚主流媒体《时代报》等国际媒体上也见过对您提出的人脸年龄估计技术所做的报道。人脸年龄估计是个很有趣的研究课题,这里面的主要难点是什么?您是如何攻克的?

人脸年龄估计的主要难点在于训练数据的不充分和不完整,也就是有年龄标记的人脸图像不够多,同一个人从小到大的每个年龄的一整套照片几乎不可得。

为了解决这些问题,我们一方面从示例端(人脸图像)入手,构造一种包括一个人从小到大所有人脸图像的特殊数据结构,称为“年龄成长模式”,然后以这种年龄成长模式为训练样本设计学习算法。另一方面从标记端(年龄标记)入手,构造一种覆盖真实年龄周围相近年龄的特殊监督信息,称为“标记分布”,然后针对以标记分布标注的人脸图像设计学习算法。以上两项工作均发表于TPAMI。

我们听说过您与合作者提出的年龄估计算法已经成为该领域的基准算法,能让自己的算法成为基准,这是很多学者梦寐以求的事情,您能给我们介绍一下该算法成为基准的过程吗?

我们提出的AGES算法是国际上第一个估计精度超过人类水平的计算机算法,该算法2014年作为年龄估计基准算法之一被写入美国国家标准技术研究所(NIST)的7995号报告。我们在著名的人脸年龄数据库FG-NET上提出的LOPO测试方案和MAE+CS评价指标已成为国际上评价年龄估计算法的事实标准,在NIST的7995号报告中被用作年龄估计算法的标准评价指标。人脸年龄估计问题的提出者和FG-NET数据库的公布者,国际模式识别学会(IAPR)会士、英国机器视觉学会(BMVA)前主席、曼彻斯特大学的Timothy F. Cootes教授及其合作者2016年撰文指出,LOPO测试方案是在FG-NET上的“最优方法”(“optimum approach”),AGES在FG-NET上的结果是“第一个标准化的年龄估计结果”(“the first standardized age estimation results”),并“强烈建议”(“highly recommended”)未来在FG-NET上测试的所有算法均采用LOPO方案。

随着创新创业蓬勃发展,大家对校企合作的兴趣也越来越浓,我们了解到您的人脸年龄估计技术也在江苏某企业中有所应用,并且使企业新增经济效益近4000万元,能介绍一下您是如何推进校企合作的吗?您自己想过出去创业吗?

这方面的经验并不是很多,与企业的合作更多是一种偶然,企业对我们做的技术感兴趣,对他们的产品也确实有帮助,就创造了一定的经济价值,并没有刻意去做什么。创业我想最重要的是要有一个配合密切的团队,而不仅仅是技术,目前条件还不成熟。

我们知道东南大学的模式学习与挖掘(PALM)实验室是您一手创建的,能讲讲您创建实验室的故事吗? 同时请介绍一下实验室目前的情况以及接收研究生和访问学者的条件。

刚刚到东南大学工作的时候,发现从事我这个方向的老师很少,那时就决心创建一个新的实验室。经过8年左右的发展,我们的PALM实验室从无到有,从弱到强,逐渐发展成由教授3名、副教授2名、讲师1名、博士后2名、博士研究生8名和硕士研究生32名组成的研究团队,实验室的主要研究方向模式识别、机器学习和数据挖掘成为东南大学计算机学科发展最快的研究方向之一。

PALM实验室每年会在7-9月举行2-3次面试,欢迎对模式识别、机器学习和数据挖掘方向感兴趣的同学和老师申请研究生和访问学者。至于条件,最重要的是相关方向的论文发表记录,如果没有发表记录,则重点考察数学和英语能力,另外,清晰的表达能力和快速融入集体的能力也很重要。

您是很多期刊和会议的编委或审稿人,您自己也发表了50余篇论文。请您从审稿人的角度谈谈如何能写出质量更好、更容易入审稿人法眼的论文。同时也请给大家分享一下您的审稿经验,如何在最短的时间内对稿件给出一个准确的判断?

现在每位审稿人都要处理大量稿件,如何能够通过题目和摘要这些“第一印象”就抓住审稿人的眼球我想是非常重要的。通常审稿人看完题目、摘要就能初步判断文章的创新性,看完第一节introduction就能判断作者的研究基础,到此基本就可以对是否录用有个基本的判断了,后面再快速浏览一下技术部分和实验部分,其实多数情况下也就是在为自己前面的判断找依据。所以,一篇好的论文除了立意新颖、实验充分这些内在因素外,我个人认为最为重要的就是题目、摘要和第一节的撰写。

据我们了解,您的论文被引用的次数很多,能给我们简单介绍一下被引用情况吗?论文引用情况一直是学术评价的重要指标,您觉得如何评价学者的学术水平更合理?

我的论文目前他引2300多次,这跟很多同行比起来并不算多。至于学术评价,这一直是一个仁者见仁智者见智的事情。相对来说,论文引用率是个不错的客观指标,同时还要看领域内有公信力的著名专家具体是如何评价的。国内近几年逐渐开始重视论文的质量而不是数量,比如要求申请材料只提交最具代表性的5篇论文,我认为这是一个好的势头。

(编者注:耿新教授所发表的论文中,EI收录的42篇论文已被国际同行他引2354次(Google Scholar),篇均他引56次,其中单篇最高他引637次,单篇他引超过100次、200次、300次和400次的分别有5篇、4篇、3篇和2篇。SCI收录的18篇论文被SCI他引776次(Web of Science),篇均SCI他引43次,单篇最高SCI他引278次,单篇SCI他引超过100次的3篇。论文引用者来自美、英等40余个国家和地区,单位包括卡内基梅隆大学、斯坦福大学、麻省理工大学等著名研究机构。引用者中不乏相关领域的国际权威学者,包括10位中国/美国/英国/加拿大/新加坡科学院或工程院院士、4位模式识别领域最高奖King-Sun Fu奖获得者和2位计算机视觉领域最高奖Marr奖获得者。)

您在教学科研的同时,还兼任实验室主任、副院长、CCF青工委执行委员、江苏省计算机学会理事、青年工作委员会主任、多个学会专委会委员、会议主席和期刊编委等职务,您是如何协调安排这些工作时间的?您怎么看待“学而优则仕”?

学者担任各类学术兼职是国际通行的做法,这也是作为学术共同体中的一员应尽的义务。至于行政职务,那就要看每个人的具体情况了。行政职务确实会消耗大量的时间和精力,但是能开阔视野、形成大局观、锻炼管理团队的能力。至于工作时间,只要做好时间管理、提高效率,是可以做到较好的平衡的,这本身也是一种能力的锻炼。总之,我觉得“学而优则仕”并不是一个普遍适用的原则,要根据自身的情况和未来的规划具体问题具体分析。

您曾在澳大利亚Deakin大学攻读博士学位,现在也有很多学生想出国深造,您能分享一下申请国外高校的经验吗?

申请国外高校,我觉得最重要的是把握好两点:第一,找一个好的方向;第二,找一个好的导师。

您觉得国内外高校的教学、科研和管理方面有什么主要不同之处?

国外高校对教师的要求比较单一,只需要关注好自己的教学和研究即可,对教学的要求很高。国内高校目前对教师要求则更为繁杂,除了教学科研,各类培训、评估、考核、检查等的频率要明显高于国外高校,这可能是国家为建设一流大学加强管理的必经阶段。

现在国内外的很多学者都喜欢利用假期旅游、登山、探险,您觉得这是在解压还是在寻找学术灵感?您有什么业余爱好?闲暇时间一般怎么度过?

目前科研工作者普遍压力较大,很多人身体都处于亚健康状态,国家也很重视这个问题,我想未来一定会出台措施为科研人员减压减负。工作时间之余做一些自己喜欢的事情,我觉得是必要的,可能对我来讲单纯是为了休息和减压吧,一般喜欢看看电影之类的,这类闲暇时间一般不考虑工作上的事。

您跟留学的学校还有科研或教学方面的合作吗?您觉得怎样才能把教学科研领域的国际合作卓有成效地建立起来并可持续的延续下去?

因为回国之后选择了新的研究方向,所以跟留学时的学校科研方面的合作并不是很多。要想长期稳定合作,我想至少要保持研究方向一致,并且能够优势互补。

目前,海外求学安全问题是热议的话题,您能谈谈在海外如何注意人身安全问题吗?

我不觉得这是个很大的问题,也许是国外的媒体对某些事情报道的比较多造成的错觉吧。

我看过一些阿兰•图灵、冯•诺依曼的故事,他们从小就表现出天赋异秉。中国有句古话说“三岁看到老”,您觉得这句话有道理吗?能讲讲您小时候的故事吗?您觉得要培养一个未来的科学家,应该给孩子营造一个什么样的成长环境?

我觉得很多名人的故事都是成名之后再由别人按照一个事先设定的模式去挖掘整理出来的。所以在我看来,每个人的成功都是不可复制的,每个人做好自己眼下的事情才是最重要的。对于培养未来的科学家,我可能没有多少发言权,因为自己的孩子还没上小学。但是我想,最重要的是要呵护好孩子的好奇心,以及培养面对挫折的勇气。

 

耿新,国家优青,江苏省杰青,东南大学计算机科学与工程学院教授、博导、副院长,分别于2001年和2004年在南京大学计算机科学与技术系获得学士和硕士学位,于2008年获得澳大利亚Deakin大学博士学位。2008年、2014年历任东南大学计算机科学与工程学院副研究员、教授,2011年起任东南大学计算机科学与工程学院、软件学院副院长。创建东南大学模式学习与挖掘(PALM)实验室并担任实验室主任至今。目前主要从事模式识别、机器学习、计算机视觉等方面的研究。在重要国际学术期刊和会议发表论文五十余篇,编撰学术文集一部、撰写专著章节2章、申请国家发明专利16项,其中6项已获授权。现为中国计算机学会(CCF)青年工作委员会执行委员,CSIG视觉大数据专委会副主任,IEEE计算机学会南京分会副主席,江苏省计算机学会理事、青年工作委员会主任,CCF人工智能与模式识别专委会、计算机视觉专委会委员,中国人工智能学会机器学习专委会、模式识别专委会委员,澳大利亚科学与工业捐赠基金项目评阅人,《Frontiers of Computer Science》青年编委,第15届亚太人工智能国际会议(PRICAI’18)程序委员会主席,2013年视觉与学习研讨会(VALSE’13)共同主席,人工智能顶级国际会议IJCAI’17/’16/’15高级程序委员会(SPC)委员,IJCAI、NIPS、CVPR、ICCV、AAAI、ACMMM、ECCV等重要国际会议的常年程序委员会委员,《TPAMI》、《TIP》、《TMM》、《TKDE》、《TNNLS》、《中国科学》等重要国内外期刊审稿人。

(责任编辑:刘海波 余烨 韩爱丽)

委员好消息

  • 2017年4月1日,据教育部新闻办公室官方微博消息,经学校推荐、通讯评审、会议答辩、人选公示、评审委员会审定、聘任合同签订等程序,教育部最终确定440人为2016年度长江学者特聘教授、讲座教授、青年学者。CCF-CV专委会委员、上海交通大学熊红凯教授入选长江学者特聘教授,CCF-CV专委会委员、西安电子科技大学董伟生教授入选青年学者。“长江学者奖励计划”是国家重大人才工程的重要组成部分,与“海外高层次人才引进计划”、“青年英才开发计划”等共同构成国家高层次人才培养支持体系。
  • 2017年5月,在上海举行的ACM图灵奖五十年中国大会上颁发了2016年ACM新星奖,CCF-CV专委会委员、南开大学程明明教授获ACM中国新星奖,CCF-CV专委会委员、中科院自动化所申抒含副研究员获ACM北京新星奖。ACM中国理事会于2014年设立“ACM中国新星奖”,每年评选出1-2名在计算机领域有突出科研潜力的青年学者,以表彰中国计算机领域的青年学者所取得的研究成绩,推动青年学者在科研领域的发展与进步。2016年ACM新星奖的评选首先由ACM全国各分会分别评选1-2名分会新星奖,本年度16个ACM分会共评选出24位分会新星奖获奖者,ACM中国奖励委员会通过现场答辩最终选出2位中国新星奖获奖者。
  • 2017年5月10日,ICDAR2017中文识别(Reading Chinese Text in the Wild)比赛结果出炉,CCF-CV委员、中科院自动化所刘成林研究员团队获得端到端(End-to-End Recognition )识别任务第一名、文本定位(Text Localization Leaderboard)任务第二名的好成绩。CCF-CV委员、华南理工大学金连文教授团队获得端到端识别任务第二名的好成绩。
  • 2017年6月初,中国科学院公布了第十二届“中国科学院杰出青年”获奖名单,CCF-CV专委会委员、中科院自动化所黄凯奇研究员入选。今年3月10日,第十二届“中国科学院杰出青年”评审委员会组织召开终审会,按照评选办法和评选条件,对初审的20位候选人进行了综合评定,以无记名投票的方式,推选出10位人选进行公示。自1995年启动以来,“中国科学院杰出青年”评选已进行了十二届,每届评选出10人。
  • 2017年6月15日,科技部公布了2016年创新人才推进计划入选名单。根据《创新人才推进计划实施方案》规定,科技部开展了2016年创新人才推进计划组织实施工作。经申报推荐、形式审查和专家评议等环节,共产生了314名中青年科技创新领军人才、67个重点领域创新团队、203名科技创新创业人才和33个创新人才培养示范基地。CCF-CV专委常务委员、中科院计算所山世光研究员,CCF-CV专委委员、南京理工大学唐金辉教授,北京理工大学黄华教授,上海交通大学熊红凯教授,西安交通大学薛建儒教授入选中青年科技创新领军人才。创新人才推进计划是国家中长期人才发展规划纲要确定的一项重大人才工程,该计划旨在通过创新体制机制、优化政策环境、强化保障措施,培养和造就一批具有世界水平的科学家、高水平的科技领军人才和工程师、优秀创新团队和创业人才,打造一批创新人才培养示范基地,加强高层次创新型科技人才队伍建设,引领和带动各类科技人才发展,为提高自主创新能力、建设创新型国家提供有力的人才支撑。
  • 2017年6月19日,CCF-CV专委会常委、北京大学林宙辰教授的新书《Low-Rank Models in Visual Analysis: Theories, Algorithms, and Applications》由Academic Press出版。该书综述了低秩模型及其应用于视觉分析领域的研究现状,剖析了模型和算法背后的思想,详细推导了计算公式,介绍了低秩模型在视频降噪、背景建模、图像对齐与校正、运动分割、图像分割和图像显著性检测等方面的应用。读者从中可以了解到哪种低秩模型(线性或非线性的)更实用、如何高效求解低秩模型和如何应用低秩模型解决实际问题。

(责任编辑:刘海波 余志文)