欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

增强现实(AR)为什么可以无中生有?看一看魔镜背后发生的事情

2023-02-05 18:37:03 1232

摘要:基于图像识别的增强现实体验一张纸上凭空出现折叠纸飞机的3D生产线、工业机器人,而且还是动态运转的状态,是不是很神奇!今天我们就一起来看看发生在魔镜背后的故事。要想搞清楚增强现实(AR)技术的底层运行过程,有必要回到本源先来看看AR的基本定义...

基于图像识别的增强现实体验

一张纸上凭空出现折叠纸飞机的3D生产线、工业机器人,而且还是动态运转的状态,是不是很神奇!今天我们就一起来看看发生在魔镜背后的故事。


要想搞清楚增强现实(AR)技术的底层运行过程,有必要回到本源先来看看AR的基本定义。在文献中,存在大量不同且有时相互矛盾的 AR 定义。虽然 Ivan Sutherland 是 1960 年代后期第一个创建 AR 系统的人,但Azuma 从 1997 年开始的定义在科学中被广泛使用。


“增强现实 (AR) 是虚拟环境 (VE)- 或者更常见的说法是虚拟现实- 的一种变体。VE 技术让用户完全沉浸在一个合成环境中。 沉浸时,用户看不到他周围的真实世界。相比之下,AR 允许用户看到真实世界,虚拟对象叠加在真实世界上或与真实世界合成。因此,AR 是对现实的补充,而不是完全取代它。” - Azuma 1997


根据上面的说法,AR 系统具有以下三个特征:

(1) 虚实组合

(2) 实时交互

(3) 3D注册虚拟内容

虚实组合

实时交互

3D注册虚拟内容

虽然第二个功能也出现在VR中,但其他两个方面AR与VR有很大不同。现实与虚拟的结合通常是通过将现实与(人工)虚拟内容叠加来实现的。也就是说,观察者(AR用户)同时将真实环境和位于其中的虚拟内容对象作为一个连贯的整体来感知。虚拟内容允许进行实时交互。此外,虚拟内容还需要以 3D(即几何上)的形式进行注册。这意味着在 AR 环境中,虚拟对象在现实空间中具有固定的位置,它不会因用户交互变化或自身发生变化(例如动画)而改变,它会一直存在。换句话说,从用户的角度来看,虚拟内容的行为与位于该位置的真实对象完全相同。由于 3D 空间中的注册配准和视觉叠加是实时发生的,因此即使用户改变视角并查看环境的不同部分,这种情况也不会改变。


在科普领域,AR一词通常用于指代限于 Azuma 所描述的第一个特征虚实组合(即通过虚拟内容增强现实)的示例,而交互性、实时能力,尤其是3D空间注册经常被忽视。


按照上面给出的定义,增强现实(AR)一般可以理解为通过人工虚拟内容来丰富物理现实。在这样做的过程中,发生现实和虚拟的融合。 下图显示了一个由虚拟对象增强的真实场景的示例。

将真实环境(左)与虚拟对象(右)融合以实现增强现实(中)

至关重要的是,这种增强不会像上图那样静态地只发生一次,而是持续不断地适应观察者的不同的当前观察视角。 简而言之,忽略个别选择,AR可以通过以下五个步骤来实现:

AR原理实现步骤

视频捕捉

在第一步中,通常会记录观察者周围环境的视频图像或更准确地说是视频流。目的是捕捉现实,就是捕捉用户的真实环境。这可以使用任何类型的摄像头(网络摄像头、智能手机摄像头、电视摄像头等)来完成。在这里,对相机进行相应的校准非常重要。

捕捉的视频画面序列

追踪

跟踪通常被理解为对位置和/或姿势/方向的计算(更准确地说是估计)。在AR的情况下,必须尽可能准确地连续捕捉观察者的观察视角。然而,当现实由刚刚捕获的视频图像表示时,通常会估计所使用的相机的位置和方向加以代替。现如今,通常使用具备多自由度的IMU传感器单元(由惯性传感器、陀螺仪传感器和磁力计组成)来非常可靠地获得姿态估计。这种传感器现在内置于当前主流的智能手机和平板电脑中,但也可以作为独立的输入设备使用。与姿态估计相比,足够精确的位置估计是非常困难的。在室外应用中,GPS 或其替代方案通常为AR提供定位基础,而对于室内应用,通常采用基于计算机视觉的方法。后者具有额外的优势,即它可以同时估计位置和方向,并且还可以在户外使用。追踪的结果是实现从用户或相机坐标系到真实环境的坐标系的转换。

追踪坐标变换

注册

注册(更准确地说是几何注册)是指将人工虚拟内容锚定或正确拟合到现实中。在上一步追踪的位置和方向估计的基础上,将各个虚拟内容的坐标系与观察到的现实相互关联,使虚拟内容在现实中牢固地定位(注册)。结果就是在虚拟世界中静止的人造物体在现实中具有明显固定的位置,独立于观察者(或相机)的变化的观察视角。一个简单的注册方案如下图中所示。除了几何注册外,还有光度注册-虚拟内容的外观适应环境的灯光照明条件,这也是要求更高一级的AR效果需要考虑的因素。

使用基准标记进行简单几何注册

光度注册-内容的明暗和阴影随真实灯光改变

可视化

基于由几何注册和相应的摄像机视角产生的变换进行虚拟内容的渲染。因此,虚拟内容以正确的视角叠加在录制的视频图像上。为了实现无缝叠加,可能需要调整图像的其他方面,例如虚拟图像的分辨率、清晰度、颜色范围和对比度等。作为视频图像叠加(视频透视)的替代方案,也可以直接在观察者视角的真实内容基础上通过光学镜片执行光学叠加(光学透视)。其他重要的方面还包括真实和虚拟内容的相互叠加和遮挡,以及虚拟内容和真实环境之间的相互影响,也称为光度注册。如果其中一些方面没有得到充分考虑,尽管几何配准正确,虚拟内容很容易就会与现实脱节,简单来说就是把假的虚拟内容做成和真实效果一样很难。

图像的透视叠加

输出

最后,叠加的视频图像(或增强的视频流)显示在通常附有相机的显示器上。这可以是手持设备,例如智能手机、平板电脑或AR眼镜。原则上,输出也可以在单独的监视器上或通过投影进行;然而,在这种情况下,对于观察者来说,现实的无缝增强的印象只是部分地被创造,沉浸感的程度不高。

在智能手机上输出增强的视频流(第三视角)

除了上面介绍的AR示例之外,还存在许多其他类型。然而,所有类型的AR都有一个共同点,即它们都基于将虚拟内容以透视和视角正确的方式投影到用户环境中或先前录制的视频图像上。真实和虚拟环境之间的视角和视点必须始终保持一致。此外,虚拟视野必须与相应显示器的实际视野相对应。最后,虚拟内容的缩放比例必须适应真实环境,保持一致。


理想情况下,捕获图像的视角和用户的视角(查看增强图像的视角)也应该匹配,这样用户才能真正获得真实环境真的改变了的印象。然后,用户虚拟地通过显示器查看其背后的现实(即使根据 AR 的特性,显示器上可能仅显示现实的视频图像,就像手机这样的视频透视实现方式)。在这种情况下,我们可以把AR效果比喻成魔镜,这也是文章标题中提到魔镜的原因。在实践中,这仅在使用 AR 眼镜时才能实现具有高度沉浸感的AR效果,因为手持设备通常不支持立体视觉。下面是两个AR魔镜应用效果的示例,一个是通过平板查看人的头部X光图像;一个是在化验抽血时,有些人的血管不太好找,搞的护士紧张,病人更紧张且受罪,利用AR实现“一针见血”的效果。

AR魔镜效果-X光透视

一针见血 - AR辅助化验时血管查找

好的,关于AR魔镜背后的运行机制,今天就介绍到这里。了解了AR的运行原理后,希望大家能结合自身经历想到AR的更多应用场景,欢迎大家评论区提出自己的想法和建议,想了解更多AR相关内容,也请大家关注我的头条号。

AR,一眼万法,如去如来!

AR相关文章推荐:

什么是增强现实(AR)与虚拟现实(VR)?它们是通往元宇宙的入口吗?

AR和VR当前面临的技术挑战和未来展望

元宇宙为什么会出现?- 数字化发展演变历程

空战中飞行员如何瞄准目标?谈谈AR头盔的应用

北京冬奥会闭幕式上的数字AR中国结技术实现解析


MR、AR、VR行业从业者,技术观察员
数字化转型、数字孪生、虚实融合、元宇宙关注者
未来世界的模式探索

欢迎关注

版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网