视觉定位技术在行业场景中的创新应用

随着物联网、AI、大数据、计算机技术的快速发展,计算机视觉技术在公安、应急、住建等多个行业得到了广泛和深入的应用。在万物互联时代,人们生活中的种种需要均与位置息息相关,定位需求无处不在,如出行导航为乘客和司机提供了精确的位置信息,O2O平台在提供海量产品和服务信息的同时还精准定位了用户及配送员的所在位置。目标定位作为计算机视觉领域中极具挑战性的研究课题,探讨如何在复杂场景下准确、实时获取位置信息对诸多领域的发展都有着十分重要的意义和价值。

 

当人类社会发展还处于农业时代时,由于定位技术的发展缺位从而使得迷路成为人们的普遍痛点。然而到了智能科技快速发展的现代社会,迷路问题依旧没有得到很好解决,迷路的语境仅仅是从野外迁移到了城市。

 

一方面,现有关于解决定位问题的主流解决方案如GPS、GLONASS、北斗等已基本具备满足室外开阔场景下的定位需要的要求,如车载导航、手机导航等,但是却无法有效解决有遮挡的场景下的定位问题,如城市峡谷、地下停车场、大型高铁站、地铁站等室内场景,在这些场景下无线电波的传播会因为障碍物的遮挡发生散射、折算或反射作用,从而大大影响定位的精度和准确性。同时,GNSS在内的无线电定位技术属于3DoF,没有定向信息,靠电子罗盘定向容易被干扰,使得此类定位无法满足指向性传感器的需求。

 

另一方面,蓝牙、UWB等无线电定位系统面临成本高、难维护且作用距离短等缺陷,同时在精度上也难以满足特定复杂场景下的需要,如Wi-Fi定位精度一般为2-5米,蓝牙定位精度一般为4米左右,蜂窝定位技术的精度一般为10米以上。

 

一、视觉定位技术的发展背景


近年来基于视觉传感器的视觉定位技术受到了广泛的关注,该技术基于相机交互的方法,利用视觉传感器获取环境图片并提取特征值来获取当前相机的实时位置和姿态的变化情况,进而实现定位的需求。视觉定位技术的起源和发展同人工智能技术类似,都是从模仿人类的角度出发。稍加思考我们就会有这样的疑问,为什么人类无需借助任何辅助设备,只靠视觉就能在熟悉的场景中知道自己在哪,知道该如何走,并且能够顺利到达目的地?人是如何做到纯靠视觉进行定位和导航?

 

我们可以发现人的这一定位行为具体由以下两个过程组成:首先,人去过一个区域后,大脑中会构建出这个区域的地图,即建图;其次,人再一次来到这个区域会识别出之前去过的区域,并通过各种地物特征分析出自己在地图上位置,即重定位。而这两个过程都可以被计算机模拟,视觉定位技术因此应运而生,并且由于其具有成本更低、适用范围广等特点,在实际应用过程中更加直观且更容易被用户感知而受到了各个行业的重视。

 

二、视觉定位技术的基本原理

 

视觉定位技术的关键步骤主要包含基于视觉的三维重建(建图)和基于视觉的定位(重定位)两个部分。接下来对其相关技术的基本原理进行简要介绍:

 

1、基于视觉的三维重建技术

 

针对于室外场景的模型重建,主流的三维重建技术通常采用摄影测量技术。以摄影测量技术中的倾斜摄影技术为例,一般来说使用无人机设备通过倾斜摄影技术开展航空摄影测量工作的整体作业流程包括资料收集、技术方案设计、航摄准备、倾斜航空摄影、像控点采集、航测成果检查、空三加密、影像密集匹配、纹理映射、生成三维模型、质量检查、提交成果,要求严格控制质量关键节点,各环节质检合格后方可移交下一环节。其倾斜摄影模型数据生产流程图及成果展示如图1、图2所示。


111.jpg

图1  倾斜摄影模型数据生产流程图

222.jpg

图2  倾斜摄影成果图

针对室内地图的构建问题,一般需要借助SFM(Structure from Motion,运动恢复结构),与室外倾斜摄影技术的内业数据处理流程大体类似,SFM的技术框架也主要包含以下四个步骤:数据采集、特征点提取、数据关联、结构恢复等。而在处理算法层面来看,数据处理主要分别包含以下五个流程:提取图像特征、连续桢特征匹配、轨迹匹配、相机姿态求解、恢复三维环境点云地图等。依照上述原理,通过视频采集及服务端建图的方式来完成对目标空间高精地图的构建工作。

 

2、视觉定位技术

 

视觉定位技术的基本原理是对相机拍摄到的环境图片进行特征提取,并将提取到的特征点与通过三维重建技术构建的模型进行检索和匹配,根据提取到的一致性信息不断求解当前画面在模型中所处的位置与姿态,如图3所示。而按照系统中相机的个数,视觉定位技术又可分为多目视觉定位、双目视觉定位和单目视觉定位。


333.jpg

图3  特征点匹配定位示意

三、视觉定位技术的发展趋势

 

1、实际落地应用将与AR、AI等技术相融合

 

如果说视觉定位技术借助三维地图重建、计算机视觉分别解决了“场景所在区域的全局地图建设”“用户处于当前场景中地图里面的哪个位置”这两个问题,视觉定位技术与AR(Augmented Reality,增强现实)技术的融合将进一步解决了“如何引导用户以更为友好、更为直观的方式顺利到达目的地”的问题。AR技术可以简单理解为通过融合虚拟信息世界和真实物理世界,在真实世界中叠加一些必要的虚拟信息,实时计算当前摄像机影像所处的位置和角度变化来引导呈现虚拟信息,进而帮助人们更好的理解真实世界。AR技术与视觉定位技术的融合可谓是相辅相成,AR技术的运用将会为视觉定位技术的应用提供“所见即所得”的交互体验,充分利用其可视化方面的能力从而大大提升产品和服务的用户体验。

 

位置、状态、事件、资源这四大要素是不同行业场景下的通用关注要素,围绕着这四大要素进行业务构建方可完成业务流程的闭环。如果说视觉定位技术解决的是位置问题,那么AI技术解决的是状态问题,当感知到人的不安全行为与物的不安全状态时进行事前预警,事件和资源则是事后处置流程中的必须要素。因此,可以预见的是视觉定位技术的落地将与AI、AR等技术紧密结合,利用AI带来的智能化来提升AR的想象空间,提升业务应用效率和用户体验。

 

2、应用领域将逐步下沉到To C市场

 

从技术发展的普遍规律来看,任何一项智能技术的发展和应用,其演进历程几乎都依次经历了从军工(航天)、到政府(To G)、到企业(To B)、到B2B2C、再到消费者(To C)这几个阶段,在此暂不论述规律背后的原因。从目前的发展现状来看,视觉定位技术也符合技术演化的大趋势。

 

针对To G方面,现阶段视觉定位技术将大大提升政府部门的工作效率。以公安行业的相关业务为例,视觉定位技术的使用将对视频监控的应用效率产生显著影响。当前行业内对视频监控的使用,普遍的应用场景是在发生事件后,利用视频监控去查看事发地点周边的视频画面,这就意味着一线公安民警需要在大量的视频监控中进行筛选出周边的视频监控,由于视频设备的位置信息不准确,确定周边视频这一过程将会浪费大量的时间成本。而随着视觉定位技术和AR三维实景融合技术的融合应用,针对全市乃至全省范围内的视频设备在三维地图上的覆盖范围一目了然,通过对其进行可视域分析从而掌握该区域范围内的水平覆盖率,对前端摄像机设备进行查漏补缺和去盲补重。

 

针对To B方面,视觉定位技术将深入和赋能到实际业务流程中去,为企业的生产和运营降本增效。视觉定位技术可完美应用于企业风险巡检,一线巡检人员只需手持智能终端,即可在终端实时画面中查看当前区域的设施设备的实时风险状态,大大提高企业的安全巡检效率,降低人力成本的同时也实现了对企业风险底数清、状态明的目标。而随着技术的不断发展与成熟,视觉定位技术将逐渐应用到To C市场,如AR导航,实现实时定位并通过AR虚拟路线引导用户到达目的地;AR营销活动,在导航过程中根据用户的位置和用户画像,智能推荐用户附近的营销活动信息;AR智能推荐,识别用户所扫描的场景,智能推荐场景内容,如对机场内的商户、服务设施、广告牌等进行识别后,展示相应的商户信息、服务指南和营销内容;除上述举例的应用场景外,AR游戏等娱乐场景也将为企业创造巨大的营收价值。

 

四、基于视觉定位技术的便民服务应用

 

广州南站核心区0.5平方公里、中央商务区4.5平方公里,室内面积广、客流量多、人流密集,2021年春运期间,仅统计1月28日至2月23日,广州南站共服务到发旅客841.8万人次(日均31.2万人次)。在车站内部,站内公共设施服务众多,旅客的内部路线距离较远且复杂,由于在室内场景常常面临GPS信号不准确不稳定、实体指引标志覆盖不全面、旅客判断方向难等情况,首次到站或对车站不熟悉的旅客常常会遇到上车点、洗手间、服务台咨询台、出租车乘车点、检票口等类似目的地导航的问题。

 

利用创新技术改善提升广大群众的生活,以人民需要为中心、为群众干实事,既是科技创新的源动力,也是广州番禺警方的科技赋能警务的实践方向。基于AR+视觉定位技术的广州南站AR导航平台,为广大旅客提供了室内AR导航服务,大大提升旅客的进出站效率和公共设施的便利使用体验。平台会根据旅客手持手机的相机姿态和匹配场景环境的特征情况,实现厘米级精度实时定位,准确辨明旅客所在的位置和视角。旅客只需点击或输入搜索需要到达的目的地和服务点,平台将在实时画面中通过AR虚拟路线来引导旅客到达对应的目的地,给用户提供所见即所得的交互体验,全面提升旅客的乘车体验。

 

五、结语

 

随着视觉定位技术的不断发展与逐渐成熟,摄像头、视觉定位模组、AR眼镜等前端硬件将会在视觉定位技术的赋能下不断增强和释放其自身价值,与视觉定位相对应的设备接入条件要求也将会逐渐标准化、规范化。同时,在高精度地图构建层面,众包模式将有望成为主流,在POI创建方面,AR资源创作和共享交易平台将会逐渐兴起。而随着海量室内外影像数据不断地被采集并在统一坐标系进行发布,视觉定位技术的融合应用将致力于建设和不断完善一个全球导航定位星座,最终打造一个全球级视觉定位服务平台以赋能千行百业,彻底满足人们不同场景下的定位需求。

文/叶盛清(中国安防协会)

行业新闻