当前位置:主页 > 衡水科技 > 文章内容

申博亚洲太阳城:让机器理解三维世界,「商汤科技」畅想人工智能3D视觉技术的未来

日期:2020-02-01 浏览:

在上世纪70年代,家产界开始运用3D视觉技术丈量和扫描物件,提高出产效率。最近10多年,家用游戏机厂商将3D体感外设带入大众视野,带来了新奇的体感游戏。近三年,越来越多的智能手机开始配备3D传感器,并在AI的加持下,开拓出了更多更具想象空间的应用场景。未来10年,AI+3D将无处不在,给我们的生活和工作带来深远影响。


申博亚洲太阳城:让机器理解三维世界,「商汤科技」畅想人工智能3D视觉技术的未来

赋予机器感知三维世界的“眼睛”

人类拥有与生俱来的3D环境感知和理解身手,这是因为我们用两只眼睛来捕捉图像,通过大脑从事惩罚形建立体视觉,从而识别物体的形状方位、别人的动作,轻松自然地跟这个三维世界交互。

能否让机器也能感知三维世界呢?或者不少人会想到给机器添加一颗摄像头。但普通RGB摄像头拍摄的现实世界的影像,仅能收集场景中的色彩信息,无法收集物体和摄像头之间的距离和方位。也便是说,无论场景中的三维布局有多么丰富,对机器来说都是一个平面,一个二维世界。

3D视觉技术,便是赋予机器感知三维世界的信息和身手,并给我们带来颠覆性的价值。试想一下,将汽车立体模型通过增强现实(AR)技术投射出来,客户可360度观看,还能“开车门”,由此直观地提出意见,而不是一张张翻看照片;可能派无人机探索丛林或洞穴,一边前行一边绘制周边场景的三维地形,而不是我们拿着一张平面地图亲自探险……

事实上,3D视觉技术目前已经在家产界取得乐成,但在消费领域,受限于3D感知硬件的资本和体积、计算身手等困扰,不少场景并未激活。除扫地机器人等个别终端外,我们的智能手机等移动设备,还处在二维世界里。但近几年,3D视觉技术终于开始走向个人终端,机器认知世界的新大门正在翻开。

3D感知硬件小型化,ToF渐成主流

实现3D视觉身手,3D感知硬件的加持至关重要。目前主流的3D感知硬件技术包含双目视觉、布局光、ToF(飞行时间)以及激光雷达。

双目视觉系统是通过双摄像头同时进行成像,然后通过相比两个图像中每个像素点的相对位置差,来计算出该像素点在三维环境中的位置,类似于人双眼的工作原理。

布局光和ToF则能在RGB的基础上直接提供深度信息,属于RGB-D方案,在精度上比双目视觉更胜一筹。此中,布局光是通过投射大量光斑到物体上,然后依照光斑的形变量来判断其所处深度;ToF则是向物体发射延续的光脉冲信号,并接收返回的信号,通过计算信号发射和返回的时间来计算深度信息。比拟之下,布局光在较短距离内拥有更高精度,而ToF支持的工作距离更长,适用于更加多元化的场景,且传感器模块少,体积小。


申博亚洲太阳城:让机器理解三维世界,「商汤科技」畅想人工智能3D视觉技术的未来

激光雷达的原理与ToF类似,但其感知距离更远,范围更大,精度也更高。不少自动驾驶汽车通过激光雷达来感知周围环境,不过缺点是资本过于昂扬,只适用于特定场景。

在最近的三年,我们察看到的一个显著趋势是ToF和布局光的小型化,使得它乐成地应用到了手机傍边。而ToF以其体积更小、适用场景更广等优势,逐渐受到更多厂商青睐,不少最新的旗舰手机都将ToF作为一大卖点。据统计,2019年有约5000万台配备ToF的手机出货,业内预计2020年、2021年将分袂到达1.5亿和5亿台,逐渐呈现出暴发态势,2020年全球智能手机3D感知硬件市场的规模也将达到99.25亿美元。


申博亚洲太阳城:让机器理解三维世界,「商汤科技」畅想人工智能3D视觉技术的未来

ToF在智能手机上的加速应用,有助于3D视觉技术的普及遍及化,成为接下来10年中非常重要的科技趋势。深入地触达消费市场,也激活了更多的应用立异也许。

AI技术,突破3D视觉技术的难点

3D感知硬件能够提供距离、深度等数据信息,但我们要的其实不是纯挚的数据,而是基于这些数据,通过不同的标明和理解方式,实现不同的应用。比方对三维场景进行数字化建模,可能绘制三维地图,从而让机器能够实时感知本人在所处空间中的位置,以便在运动时及时避开障碍物等。这须要依照深度信息生成深度图像,并与RGB图像,甚至是红外图像进行融合并完成大量计算。

但是,通过硬件感知的信息生成的深度图像,往往存在因硬件性能限制而发生的瑕疵,譬喻在细小或复杂交错的物体之间,浮现深度信息估计过失等问题。此外,精准度、鲁棒性、实时性、效率等都是决定实际应用成绩的关键。这都须要依靠额外的算法进行实时从事惩罚予以增补和增强。