视界无限-第三期CCF-CV“视界无限”系列研讨会于中山大学圆满结束

第三期CCF-CV“视界无限”系列研讨会于中山大学圆满结束

阅读量：1178

2019-07-13

2019年7月6日，由中国计算机学会计算机视觉专委会主办、中山大学机器智能与先进计算教育部重点实验室承办的第3期CCF-CV“视界无限”系列活动——“行人重识别（ReID）的前沿进展与未来趋势”研讨会在中山大学数据科学与计算机学院成功举行。本期研讨会由计算机视觉专委会委员、中山大学郑伟诗教授组织和主持。研讨会邀请了华为诺亚方舟实验室田奇教授、武汉大学胡瑞敏教授、清华大学鲁继文副教授、中国科学院大学马丙鹏副教授做主题报告，中科院自动化所杨阳助理研究员、商汤科技伊帅研究员、高新兴中央研究院毛亮副院长参加了深度研讨环节。来自全国高校和企业的100余名参会者汇聚羊城，就ReID的理论与应用进行了热烈的交流和深入细致的探讨。

会议议程依次包括引导发言、主题报告、海报/系统展示、深度研讨四部分。首先，计算机视觉专委会副主任、中山大学赖剑煌教授致辞。赖老师对与会嘉宾和师生表示欢迎，然后分别介绍了专委会的组织结构、职能目标、举办的主要活动，以及中山大学承担的项目情况、科研平台、ReID在中山大学的最新研究进展。最后，赖老师祝愿本次研讨会如雨后初晴的广州天气一样清新、热烈，希望通过深入研讨推动ReID同行之间的交流、促进合作、提升影响力，并祝愿研讨会圆满成功。

郑伟诗教授的引导发言题目是“弱监督行人重识别”。他指出，虽然行人重识别在过去几年有了跨越式发展，已经在许多标志性的数据库上取得非常高的识别结果，但目前这些算法大量依赖标注数据以训练复杂的学习模型。当前视频监控数据量巨大，且绝大部分缺乏标注；在很多新的场景下，非常缺乏新的标注数据。为了解决上述问题，郑老师介绍了近几年针对视频监控下的无标注、弱标注数据的代表性工作，包括基于非对称距离嵌入的方法、基于相机关系的特征增广方法、基于跨域协同的域适应方法、基于局部区域特征学习的方法等。

田奇教授以“行人重识别：挑战与最新进展”为题，深入浅出地介绍了行人重识别的任务定义、主要难点和基准数据集。然后依次介绍了全监督、弱监督、无监督的行人重识别方法。最后，田老师从学术与工业双重视角出发，给出了行人重识别当前的开放问题以及下一阶段值得关注的重点。

在主题报告环节，胡瑞敏教授的报告题目是“面向社会安全的视频长程群体行人重识别与多元分析”。不同于主要面向个体查找的传统行人重识别应用，安全场景具有单次跨越多摄像机（长程）、多人合作作案（群体）特点，行人重识别技术面临新的挑战。胡老师团队基于街区视频和手机轨迹数据开展行人重识别多元分析技术研究。在人体3D精细模型表达与协同建模方法、个体/群体轨迹序列组合差异、简单社会活动条件下个体时间运动和粗粒度社会活动规律及身份辨识技术等方向开展研究。有效提升街区群体长程活动行人重识别的准确率，探索并发现了从行人、空间、时间、社会多元数据角度开展交叉研究的新途径。

马丙鹏副教授的报告题目是“视频行人重识别研究”。马老师指出，传统方法更多是针对基于单帧行人图像的行人重识别问题，但是通常单帧图像的信息是有限的。最近几年，随着行人数据的增加，基于视频片段的行人重识别也越来越受到重视。在此基础上，马老师介绍了基于行走周期的视频片段分割和行人特征提取，视频片段中神经网络模块的设计，视频片段中低质量行人图像的补全等最新技术。

鲁继文副教授的报告题目是“基于深度度量学习的行人重识别”，重点介绍了清华大学自动化系智能视觉实验室近年来提出的多个面向行人重识别的深度度量学习方法，包括深度迁移度量学习、多视图深度度量学习、深度对抗度量学习等，以及它们在图像行人重识别、视频行人重识别、多模态行人重识别、跨场景行人重识别、摄像机网络行人重识别中的应用。

在海报/系统展示环节，共有来自企业和高校的12篇论文海报和2个系统进行了演示，为与会者提供了更多细致交流和深入探讨问题的机会。

在Panel环节，与会嘉宾与现场师生就“ReID的理论价值与应用场景”、“ReID的数据集现状与挑战”、“ReID落地的难点”、“ReID研究的东西方差异”等问题展开热烈讨论，参会者也就自己关心的问题与嘉宾交换了观点。

最后，第3期“视界无限”研讨会在热烈的掌声中圆满结束。

观点分享

为了惠及广大的研究者，每期“视界无限”精选嘉宾观点以快问快答的形式进行分享。

Q1: 学术界做监督学习的ReID，数据集远不如企业界大，怎么办？

A1: 学术界与工业界加强合作，发挥各自特长。（胡瑞敏）

A2: 深度学习主要有三个要素：计算资源、数据、算法。学术界有可能做的比公司好的东西就是在算法上，学术界要做公司做不到的事情。在性能外，更重要的是看思想，更应该注重方法层面，更宽容地看待性能。（鲁继文）

A3：是不是数据集越大就性能就越好？数据集大到一定程度应该有一个拐点。身份的本质是什么？这进一步地引申到，每一项工作应该是有边界的。视频的工作范围是有边界的，人脸识别和行人重识别可辨识的程度不一样，近距离的身份识别用人脸，中远距离用行人重识别。我怀疑大数据集的作用，短时可能有提高，但是长期发展来讲可能并不能带来很大的提高。（胡瑞敏）

A4: 学术界和工业界关注的目标是不一样的，刷性能斗不过企业。学术界应该关注新问题，走在公司的前面，给公司开路，然后公司做的更好，如果做的和公司一样就没有意义了。应该研究新的问题和新的方法。（马丙鹏）

A5：如果仅以识别性能为目标的话，数据量是一个非常关键的因素。在数据量足够的情况下只需要最基本的网络结构就可以了，调优技巧反倒显得不重要。（杨阳）

Q2: 企业是如何获得ReID数据的，最新的性能如何？

A1: 在学术界的小数据集上比较可行的方法，放到十几万级别就有可能看不到任何的性能增长。建数据集不单单是花钱的问题，一开始的时候是一个月一千左右的人工标记结果，后面通过迭代的策略，产生大量高质量的标记，才能得到真正大规模的数据集。后面从百万级到千万级的增长，指数级的增长才能帮助这个领域更好的发展。（伊帅）

A2: ReID相对于人脸识别的精度还不够，但是其召回率会更好：在路上的行人，摄像头很难获得清晰的人脸，但是行人区域不会完全遮挡，两者结合能够进一步提高。ReID对场景的依赖很严重，新场景下的应用会下降，目前通过自动化模型升级来解决。（伊帅）

A3: 从产品落地的角度想，获取数据集的主要挑战是场景选择。其中，开放式的应用场景如室外监控摄像头等，因场景不受控，数据采集和处理比较困难。限定式的应用场景如无人零售，要想获得行人的轨迹依然面临较大挑战。比较适合的是室内可控应用场景如执法办案场所。执法办案场所场景的好处在于不需要进行大规模改造，只要更换部分相机，且流程可以复制，不需要重复开发，获取的数据质量也更高。(毛亮)

Q3: ReID的落地面临哪些挑战与机遇？

A1: 视频在安全领域相关的场景下，如重大案件，是可以让大数据不起作用的，也就是数据静默。只有视频没有办法解决所有问题，就安全和行为分析为例，数据是小尺度，如果不能够把其扩展到大尺度空间，那么就无用了。行人重识别如果能上升到可信身份，那么用途就大了。比如在小区中，利用行人重识别获取每个行人的轨迹，通过轨迹分析行为。也就是说让行人重识别的输出做行为分析的输入。（胡瑞敏）

A2: 适当的场景很重要，我们可以控制背景、流程，方便模型的赋值。这种可复制的场景并不多。室外的场景就很难做，尤其各种差异导致模型难以复制。另外如无人超市，缺乏行业标准，而适当的场景容易制定和遵守标准，能够赋值，遇到应用的问题，那么就可以抽象出问题进行解决。(毛亮)

A3：算法到实际应用，其中还有工程化的环节。场景不一样，怎么部署、调参也不同。这些东西不适合大学去做。应考虑提出“ReID+”的概念，寻找ReID跟检测、跟踪的结合。算法和技术是有边界，应当明确技术哪些能做，哪些不能做。（鲁继文）

A4：主要的问题在于数据采集时用户不会主动配合，那么可以设置和寻找让用户愿意配合的情景，如果可以让用户配合，那么提高数据质量就可能进一步提高识别准确率。有怎样的输入就有怎样的输出。（马丙鹏）

Q4: 目前ReID领域华人做的比西方做的更多，原因是什么？

A1: 其实ReID问题本身来自欧盟，只是我们做得更快、更大，而且有更多人参与。还有数据集更易采集，我们相对更注重于安全，国外更注重于隐私。（马丙鹏）

A2: 我们比较注重安全问题，而且我们的监控摄像机的数量遥遥领先，具有大量的数据，还有就是商业需求。另外国内和国外对于公共与个人的边界有一定差别。（胡瑞敏）

A3: 国人有应试教育的经验，更偏向于立竿见影的研究，喜欢以性能和应用为导向；国外则更偏向于兴趣导向。（杨阳）

Q5：从人脸识别到行人重识别，下一个方向是什么？

A1：从人脸识别到ReID，最终都是做身份识别，身份识别包括有三个问题：精准、健壮、对抗。身份社会安全的核心问题，真正大规模应用应该解决对抗性的问题，其中还有很多需要解决的问题。（胡瑞敏）

A2：在ReID领域，对于场景、着装、角度等差异性影像因素，其实我们可以通过游戏引擎进行定量的分析研究，可能是一个值得探讨的方向。（杨阳）

Q6：ReID换衣服的问题非常有挑战性，其难点和解决思路是什么？

A1：行人重识别和人脸识别的差异在于距离、分辨率。本身就依靠视觉特征，如果服装换了，本身就低分辨率，那么问题就变得很困难了。我们需要找到的是换服装和不换服装的视觉不变特征。（胡瑞敏）

A2：我们需要关注ReID的研究边界，可能存在细微的特征差异，但是是否存在可计算的解，这个才是问题。（鲁继文）

A3：我记得伟诗做了一个红外的数据集，这个应该就能解决换衣服的问题。如果有更多的信息进行辅助，如声音、小群体的多人关系，则可以进行多模态融合的行人重识别。（马丙鹏）

A4：研究方法是有边界的。对于企业来说，可以通过引入更多的信息，比如穿戴式的设备加以解决。我们在自己的场景下设置了脱衣报警。另外在不同的相机下，如RGB、红外、热像仪等，处理方法就不同了。（毛亮）

A5：换衣可能不是ReID的问题，但是工业界需要解决。可以用别的信息进行补充，如果获得了一张清晰的脸，那么就可以用人脸识别进行辅助。另外ReID和人脸的特征差别很大，我们很多的方法都是从人脸识别借鉴来的，但是两者的特征差别是很大的，如果有针对行人重识别的算法，应该有一定的提升。还有就是考虑多模态信息融合做身份辨识，包括声音、人脸、步态、小群体等，把一些基础模块整合在一起来提升模型识别的能力。（伊帅）

<<< 上一篇第五期CCF-CV“视界无限”系列研讨会于上海科

第四期CCF-CV“视界无限”系列研讨会于大连理下一篇 >>>

<<< 下一篇第四期CCF-CV“视界无限”系列研讨会于大连理

第三期CCF-CV“视界无限”系列研讨会于中山大学圆满结束

推荐内容

计算机视觉专委会