【5月15日开讲!】欢迎报名第一届CCF计算机视觉前沿讲习班

阅读量:0
2021-05-28


举办时间:2021年5月15日~5月16日

报名时间:2021年3月30日~5月16日

会议地点:湖北省武汉市武汉理工大学(马房山校区) 会议中心201

主办单位:中国计算机学会

承办单位:CCF计算机视觉专业委员会、武汉理工大学计算机科学与技术学院

学术主任:熊盛武(武汉理工大学)、白翔(华中科技大学)

会议介绍

计算机视觉技术的快速发展推动了人工智能与各行各业的结合,并且成为当前落地最顺利、最广泛、最成熟的人工智能主干技术。相关成果应用于工业、安防、交通、医疗、娱乐、零售、农业等诸多行业,不断激活全新的商业场景,催生了巨大的市场空间和社会价值。然而,行业快速发展的背后是对高层次实用人才的大量需求,这是亟需解决的关键问题。为促进计算机视觉技术的学术交流与高级人才培养,帮助该领域青年从业者提升技术水平,开拓实践视野,掌握最前沿的理论成果和创新应用,CCF计算机视觉专委会拟组织第一届CCF计算机视觉前沿讲习班,由武汉理工大学熊盛武教授和华中科技大学白翔教授担任学术主任。面向计算机视觉领域的研究人员、学生、工程师等开设短期系列课程,帮助学员全面学习并系统掌握计算机视觉前沿技术和应用工具。

收费说明

会议门票

门票类型

参与者身份

3.30~4.30

5.1-5.16

会议注册费

CCF专业会员

¥1760

¥2000

CCF学生会员

¥1200

¥1400

非会员专业人员

¥2200

¥2500

非会员学生

¥1500

¥1800

附加活动

附加活动名称

3.30~4.30

5.1~5.16

现在加入CCF,立享会员优惠,会费标准:会员200元/年,学生会员50元/年。

简易日程

2021年5月14日

14:00-20:30 报到、注册

2021年5月15日

07:00-08:30 报到、注册

08:30-08:45 开幕式

08:45-09:00 合影

09:00-10:30 查红彬 北京大学

10:30-10:50 茶歇

10:50-12:20 陈熙霖 中科院计算所

12:20-14:00 午餐

14:00-15:30 刘成林 中科院自动化所

15:30-15:50 茶歇

15:50-17:20 韩军伟 西北工业大学

2021年5月16日

09:00-10:30 操晓春 中科院信工所

10:30-10:50 茶歇

10:50-12:20 刘其文 百度

12:20-14:00 午餐

14:00-15:30 王永攀 阿里

15:30-15:50 茶歇

15:50-17:20 于仕琪 南方科技大学

17:20-17:30 结业式

详细日程

2021年5月14日

14:00-20:30 报到、注册

2021年5月15日

07:00-08:30 报到、注册

08:30-08:45 开幕式

08:45-09:00 合影

09:00-10:30  

课程1:视觉SLAM:在线学习的途径

课程简介3D视觉的一个主要任务是利用传感器视点的变化与成像几何的约束来实现三维场景的几何与结构重建。因此,伴随传感器移动的动态视觉与3D视觉的关系愈加密切,SLAM(Simultaneous Localization and Mapping:即时定位与地图构建)技术再度成为3D视觉领域的研究热点。为了提高动态视觉系统在真实复杂场景中的应用能力,我们应充分强化视觉系统的环境自适应性,而在线学习方法是实现这一目标的有效途径。该报告将围绕基于在线学习的SLAM问题,介绍我们近来的一些想法和尝试,主要内容包括:回顾三维视觉的发展历史,指出该领域目前面对的关键技术问题。引入数据流计算的基本概念,充分挖掘密集采样传感数据内在的时空连续性,以加强SLAM算法的预测能力;构建基于时域变化的增量算法,并利用地图全局特征的约束以及传感数据的实时反馈作用,实现传感器轨迹的高效计算与三维地图的递进式构建;尝试各类机器学习算法在SLAM问题中的应用,以探讨建立自监督SLAM在线学习技术的新途径,包括:面向自监督视觉里程计的序列对抗学习方法;具有在线自适应能力的自监督SLAM学习。


授课教师:查红彬

北京大学信息科学技术学院智能科学系教授,机器感知与智能教育部重点实验室主任。主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、三维物体识别等方面取得了一系列成果。出版学术期刊及国际会议论文300多篇,其中包括IEEE T- PAMI,IJCV, IEEE T-VCG, IEEE T-RA, IEEE T-SMC,ACM T-IST, JMLR, PR 等国际期刊以及ICCV, ECCV, CVPR, CHI, ICML, AAAI,ICRA等国际学术会议论文100余篇。

10:30-10:50 茶歇

10:50-12:20  

课程2:场景的层次表达与推理


授课教师:陈熙霖

中科院计算技术研究所研究员。其主要研究领域为计算机视觉、模式识别、多媒体技术以及多模式人机接口,近年来研究兴趣集中在场景理解、人脸分析与自然人机交互等方面。陈熙霖博士在国内外重要刊物和会议上发表论文300多篇,先后获得国家自然科学二等奖一项,国家科技进步二等奖四项。

12:20-14:00 午餐

14:00-15:30  

课程3:图神经网络与文档图像分析

课程简介:文档图像(包括印刷和手写文档、票据、场景文本图像、联机手写文档等)分析与识别的任务包括文档区域分割和逻辑关系分析、文本识别、语义信息提取等。文档区域分割和逻辑关系分析又称为版面分析,受文档元素多样、图文变形、结构复杂多变等因素影响,一直没有很好地解决。近几年,用结构化预测模型(条件随机场、图神经网络等)结合深度学习的方法,在复杂文档版面分析方面取得了很大进展。结构化预测模型可以充分融合图像特征和基元区域之间的关系以及领域知识,并可以从数据进行学习,可用于各种图像的区域分割、关系分析、场景理解、行为分析等。本讲座首先介绍结构化预测问题和条件随机场、图神经网络及其学习和推理方法,然后介绍基于图神经网络的文档图像版面分析研究进展,包括基于图注意网络的联机手写文档版面分析、流程图识别,复杂文档图像区域分割和二维结构分析等。


授课教师:刘成林

中国科学院自动化研究所副所长,模式识别国家重点实验室主任,研究员、博士生导师,中国科学院大学人工智能学院副院长。1989年、1992年、1995年分别在武汉大学、北京工业大学、中国科学院自动化研究所获学士、硕士和博士学位。1996年至2004年先后在韩国科学技术院、日本东京农工大学、日立中央研究所从事博士后和研发工作。2005年起在中国科学院自动化研究所任研究员。2008年获得国家杰出青年科学基金资助。研究兴趣包括图像处理、模式识别、机器学习、文字识别与文档分析等。在国内外期刊和学术会议上发表论文300余篇,合著英文专著一本。现任Pattern Recognition期刊和《自动化学报》的副主编,以及多个期刊的编委。任中国人工智能学会副理事长、会士,中国自动化学会模式识别与智能系统专委会主任,中国图象图形学学会常务理事。美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。

15:30-15:50 茶歇

15:50-17:20  

课程4:遥感影像 “深度”解译

课程简介:遥感影像解译是遥感大数据信息挖掘与提取的关键技术,具有重要的民用和军事应用价值,也是近年来遥感应用领域的研究热点问题。本报告介绍了深度学习在高分遥感影像解译方面的一些典型应用。首先,针对高分遥感图像大规模数据库相对稀少的问题,我们发布了两个公开的高分图像数据库,分别用于场景分类和目标检测。其次,针对高分遥感影像解译存在的一些难点问题和不同的应用需求,介绍了几种基于弱监督学习/全监督学习的目标检测和图像场景分类方法。


授课教师:韩军伟

西北工业大学教授,科睿唯安全球“高被引科学家”和爱思唯尔中国“高被引学者”。获聘长江学者特聘教授,入选国家“万人计划”科技创新领军人才。主要研究方向是人工智能、模式识别、类脑计算、医学影像处理等。在领域顶级期刊/会议如:Proceedings of the IEEE,IEEE TPAMI,CVPR,ICCV,MICCAI等发表学术论文100余篇,论文被引用1.6万余次。3篇论文入选年度中国百篇最具影响国际学术论文。获国际会议IEEE BIBM 2018最佳论文奖,国际会议ACM Multimedia 2010,MICCAI 2011和ICME 2016最佳学生论文奖提名,培养多名博士生获得中国图像图形学会优秀博士论文奖和ACM SIGAI(国际计算机学会人工智能分会)优秀博士论文奖 。获陕西省科学技术一等奖(排名第一)等6项省部级科技奖,担任IEEE Trans. on Neural Networks and Learning Systems、IEEE Trans. on Cybernetics、IEEE Trans. on Multimedia等多个国际顶级期刊编委,任领域顶级国际会议如:CVPR, ICPR, ACCV等的领域主席。

2021年5月16日

09:00-10:30  

课程5:人工智能驱动的网络空间内容安全

课程简介5/6G网络和AI技术的发展正持续改善网络空间的内容和服务质量,但同时也带来各种潜在内容安全问题:一方面,伪造、虚假、不良的媒体内容充斥于网络空间,影响社会稳定和个人声誉,存在识别研判难、发现耗费大的现实挑战;另一方面,公开来源网络数据蕴含丰富的各种商业情报,但由于其价值密度极低,导致高价值信息挖掘如大海捞针。针对上述网络空间安全应用,报告人拟介绍信工所团队在该方向学术探索的最新进展,以及搭建的一套视觉大数据价值挖掘系统。具体包括:开源数据的云弹性采集与强智能搜索、数据驱动的自底向上深度抽象归纳、知识驱动的自顶向下演绎推理、人工智能深度攻防对抗等。


授课教师:操晓春

中国科学院信息工程研究所研究员,主要从事计算机视觉基础研究和网络空间内容安全应用研究;国家杰出青年、优秀青年基金获得者,入选国家“万人计划”青年拔尖人才支持计划、中国科学院“百人计划”择优支持(结题优秀);主持科技创新2030“新一代人工智能”重大项目、国家自然科学基金重点/联合基金重点项目数项,兼任IEEE TIP、IEEE TMM、IEEE TCSVT的编委(SAE或AE)、ICCV/CVPR/IJCAI/ICPR Area Chairs、英国工程技术学会(IET) Fellow、中国计算机学会杰出会员、中国电子学会青年科学家俱乐部会员;指导博士生获得CCF优博论文和中科院优博论文各1篇;获得省部级一等奖和二等奖各1项。

10:30-10:50 茶歇

10:50-12:20  

课程6:深度学习产业落地的四大挑战

课程简介:本次课程会结合百度飞桨在与各行各业的产业实践中的交流经验,与大家探讨深度学习产业落地的四大挑战;并结合飞桨的实际案例,与大家探讨解决这些挑战的方法;1. 业务挑战:什么样的产业场景适合人工智能落地?2. 人才挑战:人工智能落地,需要什么样的复合型人才?3. 技术挑战:从深度学习框架的角度,还有哪些核心技术有待突破?4. 生态挑战:需要政府、科研、教育和产业怎样相互协同,才能构建良好的人工智能产业生态?


授课教师:刘其文

本硕毕业于华中科技大学,2011年硕士毕业后加入百度,现任百度飞桨高级技术经理,主要负责百度飞桨(PaddlePaddle)的算法、模型压缩和推理团队,致力于把飞桨打造成国内人工智能产业落地必备的操作系统。

12:20-14:00 午餐

14:00-15:30

课程7:OCR&智慧教育

课程简介:讲述团队对OCR方向和应用的定义,以及我们在智慧教育方向的思考。介绍相关创新算法,和在阿里和云上的实践应用。


授课教师:王永攀

阿里巴巴资深算法专家,达摩院OCR&智慧教育方向负责人,阿里云读光产品负责人。负责OCR技术方向,技术覆盖图文检测、文字识别、结构理解、端算法、视频等方向,构建一套完整的泛OCR技术体系。发表多篇论文和专利,主办竞赛,推动多项校企合作,和高校形成良好的互补协作推动OCR的技术和产品发展。负责读光云产品,该产品在阿里集团管控、广告等和云上金融、海关等场景中应用广泛。同时,致力于技术公益项目"视觉无障碍-听图购"和"古籍识别-汉典重光"。

15:30-15:50 茶歇

15:50-17:20  

课程8:步态识别技术和最新进展

课程简介:步态识别经过20年的发展,已经达到实际应用的程度。与人脸、指纹、虹膜等生物特征相比,步态具有独特的优势。在未来几年,步态识别将会大规模部署到各种实际应用系统中。本课程将首先介绍步态识别的方法,并介绍方法的发展脉络,让学生对步态识别有一个全面的掌握;除此之外,本课程将特别介绍最近几年的方法,并对未来发展趋势进行展望。


授课教师:于仕琪

南方科技大学计算机科学与工程系副教授。于仕琪2002年于浙江大学获得计算机科学与技术学士学位,2007年于中国科学院自动化研究所获得模式识别与智能系统博士学位。2007年至2010年在中国科学院深圳先进技术研究院历任助理研究员和副研究员。2010年至2019年在深圳大学计算机与软件学院任副教授。2019年至今在南方科技大学计算机科学与工程系副教授。他的主要研究方向为步态识别和视觉目标检测。于仕琪副教授现担任中国图象图形学学会学会监事,IAPR TC4专委会秘书,IJCB2021会议程序主席,OpenCV中国团队负责人;曾担任中国图象图形学学会学会理事,CCBR2017程序委员会主席;并作为主要组织人,自2018年开始每年1月份组织IAPR/IEEE Winter School on Biometrics。

17:20-17:30 结业式

报名方式

访问讲习班官方网站https://conf.ccf.org.cn/ZvQrET或扫描下面的二维码均可报名,名额有限,请广大师生、企业界朋友尽早报名,期待与您五月相聚江城。


路线信息

会议地点:湖北省武汉市武汉理工大学(马房山校区)会议中心201

天河机场、汉口站到达:地铁2号线街道口站L口出,步行10分钟到达西院大门;

武汉站、武昌站到达:地铁4号线中南路站转地铁2号线街道口站L口出,步行10分钟到达西院大门,会议中心在进入大门左侧50米处。