第九十六期CCF-CV走进高校系列报告会(@北京航空航天大学)云直播活动圆满结束

阅读量:20
2021-05-05


2020年12月12日下午,由中国计算机学会计算机视觉专委会(CCF-CV)主办,北京航空航天大学承办的CCF-CV走进高校系列报告会第96期活动,通过线上直播的方式成功举行。本期活动共邀请了5位嘉宾做特邀报告,他们是:澳大利亚阿德莱德大学沈春华教授、北京大学林宙辰教授、西北工业大学程塨研究员、商汤科技研究执行总监代季峰博士和电子科技大学李文教授。北京航空航天大学软件学院的于茜副教授担任本次报告会的执行主席和主持人。


报告会开始由北京航空航天大学软件学院胡春明院长致欢迎辞。胡院长首先对五位报告嘉宾表示热烈的欢迎和衷心的感谢。随后,他简要介绍了北航软件学院的发展情况,并指出计算机视觉技术发展与软件工程的密切关系。最后,胡院长表达了对活动的祝愿以及希望未来进一步推进学院老师学生与专家学者们的深入交流。随后,本次报告会的主持人于茜老师向听众介绍了参加本次活动几位报告嘉宾的基本信息,并说明了组织本次活动的初衷,即让在校学生(尤其是低年级学生)接触到计算机视觉和机器学习的前沿问题,拉近学生和资深专家学者的距离。最后,她再次对来自全国各地的专家学者及中国计算机学会计算机视觉专委会表示衷心感谢。


01

报告信息


北京大学林宙辰教授的报告题目是“Training Neural Networks by Lifted Proximal Operator Machines”。报告覆盖了林老师研究组近年在神经网络优化研究方面的工作与成果。林老师团队提出了提升近邻算子机(LPOM)的优化方法,该方法在激活函数是不可导、饱和的状况下仍然适用。在部分模型条件下,优化效果和优化速度均超过随机梯度下降(SGD)。随后,林老师又向大家展示了其最新的研究成果——基于LPOM的算法级别的并行优化研究,并展示了相应的实验结果。最后,林老师又向大家汇报了其团队未来主要的研究方向,即将LPOM优化算法推广到更多的神经网络架构,为优化领域贡献了新的方法和思路。


商汤科技研究执行总监代季峰博士为大家带来了题为“VL-BERT: Pre-training of Generic Visual-Linguistic Representations”的报告。代博士首先简单回顾了Transformer模型的结构及其后续工作BERT在自然语言处理领域取得的成绩。出于希望得到适用于Vision-Language任务的类似于BERT的可泛化特征表达这一动机,代博士及其团队提出了VL-BERT,即在BERT的基础上进行修改,让其适用于Vision-Language任务。在VL-BERT模型中,每一个输入的元素来自句子中的一个单词或者是一张图片中的一个感兴趣的区域 (RoI)。通过利用Transformer的模型结构,建模句子和图片之间的关系,从而学习到一个可泛化的跨模态的特征表达。该模型适用于诸多下游任务,代博士在报告中展示了该模型在视觉常识推理、视觉问答和指代表达等任务上的表现。


西北工业大学程塨研究员的报告题目为“遥感影像‘深度‘解译”,介绍了其所在团队近年来在遥感图像领域获得的研究成果。首先介绍了遥感图像与一般图像的区别以及该类图像特有的挑战,然后介绍了由该团队收集的两个遥感图像数据集,NWPU-RESISC45场景分类数据集和DIOR目标检测数据集。随后,从三个方面介绍了其团队在遥感影像“深度”解译方面的工作,包括弱监督目标检测、型号识别和场景分类。程老师的报告深入浅出,让听众们了解了遥感影像解译的困难以及深度学习算法在这一研究领域的应用。


澳大利亚阿德莱德大学沈春华教授做了题为“Instance Segmentation Made Simple”的报告。沈老师为大家系统地介绍了其带领的研究团队近年来在实例分割任务上取得的成果。首先,沈老师为大家介绍了实例分割和目标检测的关系和异同,从宏观上分析了实例分割的研究现状和未来发展趋势。随后,沈老师为大家详细地介绍了其团队近年来的几项研究成果,包括FCOS、BlendMask、CondInst和SOLO等模型。这些模型围绕的核心思想是简化现有实例分割模型的结构,不依赖于物体检测,以及实现实例分割和语义分割的统一。


电子科技大学的李文教授以“面向自动驾驶场景的跨域图像生成”为主题做了报告。李老师首先向听众简单介绍了跨域图像生成的研究现状,并结合自动驾驶,介绍了跨域图像生成的相关应用。随后,李老师重点介绍了其团队提出的DLOW模型,DLOW模型通过生成从一个域到另一个域的连续中间域序列来连接两个不同的域,生成的中间域序列平滑地弥合了源域和目标域之间的鸿沟,从而减轻了域适应的难度。同时,该模型还能够生成训练数据中看不到的新图像样式,实现了良好的风格迁移和生成图片的多样性。

除此之外,每位专家在自己的报告环节结束后,分别回答了由线上平台收集到的听众们提出的问题。

02

活动总结

报告会最后,主持人于茜老师对报告会进行总结发言。于老师首先对进行报告的各位嘉宾以及CCF-CV专委会表示衷心的感谢,并希望以本次报告会为契机,欢迎全国计算机视觉领域的同行们来北京航空航天大学交流指导,拉近在校学生和专家学者之间的距离,为计算机视觉的发展持续地注入新鲜活力。

会议承办单位介绍:

北京航空航天大学(简称北航)成立于1952年。建校以来,北航一直是国家重点建设的高校,是全国第一批16所重点高校之一,也是80年代恢复学位制度后全国第一批设立研究生院的22所高校之一,首批进入“211工程”,2001年进入“985工程”,2013年入选首批“2011计划”国家协同创新中心,2017年入选国家“双一流”建设高校名单。学校第十六次党员代表大会提出以建设扎根中国大地的世界一流大学为发展愿景目标。

近年来,学校着力提升办学境界和格局,大力促进空天信融合发展的学科态势,持续优化创新人才培养体系,积极推进一流师资队伍建设,加快推动科研创新转型发展,务实开展高水平的国际交流合作,大力推进办学条件和民生改善,全面加强党的建设和思想政治工作,各项事业发展取得了突出的成绩。综合办学能力和核心竞争力不断增强,跻身国内高水平大学的第一方阵,国际影响力显著提升。