在科幻电影《头号玩家》构建的近未来,只要戴上VR眼镜等外部设备,就可以进入一个与现实形成强烈反差的虚拟世界。在这个世界中,有繁华的都市,形象各异、光彩照人的玩家,不同次元的影视游戏中的经典角色也可以在这里齐聚。
神秘的元宇宙概念被推向大众眼前,成为当下最热风口。VR(虚拟现实)、AR(增强现实)、MR(混合现实)、XR(扩展现实)的技术革新一浪高过一浪。消费元宇宙是距离当下最近的一种元宇宙形式。而元宇宙在工业领域的应用价值远大于消费领域。
根据灼识咨询数据,2030年工业级元宇宙市场规模将超千亿。与消费元宇宙相比,工业元宇宙更重视“由虚向实”的过程,关注解决确切场景中的具体问题。在 AR 技术应用的快速发展和渗透下,工业元宇宙已经初见雏形,在研发、装配、检修、培训等环节已经实现初步应用。
想象一下,你只需一副智能眼镜,不仅能看到一台复杂工业机器的外观,还能“透视”机器内部的几万个精密零部件和拆装方法等虚拟画面叠加在镜片上显示。
未来,工业元宇宙将进一步打破传统二维平面和实地指导操作的桎梏。分布在世界各地的工程师们或许可以不再受特定厂房限制,在一个虚拟工厂里就可以协同完成一辆汽车、一架飞机的设计,甚至可以在基础的设计上进行“私人定制”。
阿依瓦(北京)技术有限公司(ALVA Systems)就是这样一家聚焦工业AR、以底层技术算法为核心的科技企业。它是国内最早致力于异构计算(Heterogeneous Computing)应用开发的公司,现在已经是全球异构计算软件应用最为广泛的企业之一,拥有脉冲神经网络(SNN)、AR、人工智能、人机交互等多项具备独立知识产权的专利技术。在工业领域,公司重点致力于基于AR技术和制造业的深度结合应用,是国际工业物联网与“数字孪生”解决方案的领跑者。
今天,《灼识三点半》栏目,对话ALVA Systems的首席技术专家兼产品规划总监郭俊玺先生,分享AR技术如何赋能智能制造,让工业元宇宙照进现实。
受访嘉宾:郭俊玺,ALVA Systems 首席技术专家兼产品规划总监,制造业产品设计开发和工业软件应用领域20年从业经历,熟悉工业企业三维设计、研发管理,最近6年专注于增强现实、物联网等新兴技术应用与工业实践应用的结合。
灼识访谈人:柴代旋,灼识咨询总监。在人工智能、物联网和高端制造等领域有丰富的咨询顾问经验,服务过思谋科技、涂鸦智能等多个知名企业的投融资活动。
01
AR技术发展历史与阶段特征
柴代旋:
从您的视角看,AR技术经历了哪些发展历程?每个发展阶段的技术特点有哪些?
郭俊玺:
从全球的视角来看,在AR技术的领域里,国内和国外的发展进程是节奏一致的,相比之下,国外的AR技术实践领域发展得较快些。从时间维度上划分,AR技术发展主要分为三个阶段:
第一个阶段是1968年-2010年:在距今五十多年前的1968年,哈佛大学的一名教授和计算机科学家Ivan Sutherland发明创建了第一个头戴式AR装置,但因为设备太重,只能悬挂在天花板上,于是他们为其起名“达摩克利斯之剑”,这是世界上第一个AR装置的起源。
从技术原理来讲,这套系统所呈现的效果与今天的AR产品没有本质区别,然而当时AR的概念还没有出现。
直至1990年,波音公司的一个研究员在研究航空线束辅助布线时,首次使用了AR这个词,用来描述将计算机呈现的元素覆盖在真实世界上这一技术,也是AR的概念首次被提出。
这个阶段的AR技术有两个特点,一个是设备笨重,只能以悬挂的方式使用,无法灵活移动;一个是领域极其小众,研究者凤毛麟角。
第二个阶段是2010-2020年:AR概念掀起一波热潮。2012年,谷歌推出了第一款AR眼镜Google Glass,这款产品的技术路径其实并不复杂,只是“虚实叠加”概念的显示。
真正意义的突破在于2015年,微软发布了HoloLens一代,是一款真正的AR增强现实眼镜,这款产品的推出有力地推动了整个AR行业的发展,也促进了科技龙头对AR企业收并购事件的发生。
2015年5月,苹果收购了德国企业 Metaio,该公司主要研究 SLAM为基础的 AR 软件,积淀颇为深厚。同年10月,物联网软件开发商PTC宣布从高通子公司手中收购Vuforia业务。
2011年,早在Vuforia被PTC收购之前,ALVA就已经与高通在数学算法等计算技术方面展开合作,这也是ALVA与AR结识的渊源。
2016年,任天堂发布基于位置服务的增强现实类手机游戏Pokémon GO。
2017年,苹果和谷歌相继发布了AR Kit和 ARCore,这对业内来说是一个很大的冲击。在这些产品应用发布之前,只有很少部分的小众人群能接触到AR。
在2018年之后,大量的手机设备就可以开始应用AR技术了,这是对整个行业的颠覆。因为手机设备入场后,能够支持AR应用的设备数量级呈指数型增长,从原来的几千个跃升为几千万甚至几亿,带动了 AR市场从小众走向大众。
这个阶段的特点是软件和硬件都在飞速发展,并且市场升温,走向大众市场;在设备端,眼镜等穿戴设备似乎还不够成熟,但是手机平板等移动端的体验效果成熟度已经很高。
在2017-2018之前,AR成像效果尚不稳定,会出现画面的抖动和漂移,但是在谷歌、苹果两大科技巨头入场后,AR技术在移动设备上,尤其是手机终端上的稳定性大大增强。然而,在使用移动设备时,移动设备还需要占用双手,在一些场景下的使用体验不太理想,但这也是目前AR技术发展处于过渡阶段的特征。
第三个阶段是2020年到2030年,AR技术的整体发展会进入到新的阶段。谷歌和苹果在发布AR底层技术支持平台后,会继续进行功能的优化和提升。在设备端,越来越多的设备开始支持AR的功能,可应用支持AR Core和AR Kit。在使用终端,未来AR眼镜仍旧会成为终极形态,也会逐渐走向成熟。
目前的技术话语中,VR和AR是一体的,MR是既有AR也有VR的混合。
从眼镜端的发展来看,苹果预计会在2023年初发布MR硬件,同年微软也会发布新的Hololens 3,我认为这两款产品的发布会成为MR/AR眼镜发展在新时代的标志性事件。
在用户端,眼镜的形态和用户佩戴体验可能会有较大的提升和改善。在过去的2021年里,全球VR眼镜的出货量已经超过了1000万台,这说明VR眼镜作为消费电子的市场已经具备了一定的成熟度,有潜力在2022年“起飞”,而作为VR眼镜的“兄弟”的AR眼镜也将会从“伴飞”阶段发展到并驾齐驱,我们将在未来见证AR硬件的广泛应用,开启大众化市场阶段。
02
可视化、强人化、人机交互
AR三大应用价值提升企业一线人员生产力
柴代旋:
有观点说现在AR应用在智能制造与工业领域目前还“禁锢”在显示或者可视化层面,对此您怎么看?在技术层面如何实现突破并提升AR应用的附加值?
郭俊玺:
从AR的展现形式上来看,AR技术能够提供三维立体的视觉形态,这种天然的优势胜过平面二维的展现形式,这也是用户能够最先感受到的特点。
但是从AR的整体应用价值上来看,可视化只是其中重要的一个方面,其第二个主要用途是能够将“虚”的数字信息和“实”的真实环境糅合,提供了工作中远程指导的便捷性。
与完全虚拟的VR不同,VR是纯数字化、全封闭的应用环境,虽然技术更成熟稳定,但是大部分应用场景是在游戏中,不能够大范围灵活移动。
AR的应用场景更广泛,能在实际工作中提供指导信息。比如在车间作业时,AR能够直接在眼前为用户提供相关数据信息,原来使用者先在电脑屏幕上查看数据再在现场设备上展开工作,很多时候这块显示数据的屏幕跟展开工作的设备在物理空间上还分离得很远,从看两眼变成看一眼,看似容易但在实际工作时会给人在认知距离和工作记忆上带来负担。
AR能够让使用者直接在设备上获取需要的信息,快速应用到实际工作场景中。简言之,在工业领域AR的应用,其目的是“强人化”,就是让人的能力变得更强。
直观地举例,比如原本狙击手利用人眼瞄准,其距离识别精度是有限的,但是加上瞄准镜之后,在精度上有了极大的提升,这就是AR应用的目的和本质:对一线作业者提供更强的赋能。AR可以把二维平面立体化,把数据信息直观化,直接推送到实际步骤中,像一个知识容器一样,利用对知识的可视化从而降低对人的技能门槛——这也是“强人化”的体现,之前工人无法完成的,现在借助AR系统对信息的呈现也能够完成。
此外,AR是一种人机交互的方式,能实现人和虚拟数字信息的交互方式。使用者可以在一个界面里既能看到眼前真实环境和设备,也能看到跟这个环境和设备相关的数字化虚拟信息,实现从简单的虚实叠加到复杂的虚实融合的直观效果。
比如,原来使用PC电脑的方式是“鼠标+键盘+大屏幕”,现在手机变为“手指+屏幕”,再往后的AR眼镜则是“自然交互+消失的屏幕”,就像现在很多人带着近视眼镜但大多数情况下并没有意识到自己有带眼镜的情形。
从本质上讲,AR是一种人机交互的方式。总而言之,AR的可视化、强人化、人机交互是在工业领域应用中最突出的作用。
柴代旋:
从您的技术经验以及经历来看,AR技术如何为智能制造赋能,为企业的业务流程提供价值?从客户角度,他们是否可以定量地测算或者感知到这些价值?客户接受度和认可度如何?
郭俊玺:
目前AR技术处于技术普及的早期阶段,尚处于展开过程中。因为整个AR技术在工业领域的应用涉及到软件和硬件,涉及到一线工人所佩戴设备的舒适度和复杂工业环境的适配性,这些需要一定时间慢慢铺开,远没有到完全普及的程度。
就目前ALVA与工业客户交流的过程中来看,客户对于可视化呈现的价值,尤其是直观性、灵活性、交互性,都是高度认可的。但是他们对于系统在实际工作中的应用价值会有所考量:这套系统真的能为我带来价值吗?这样的效果是只能凭第三方专业AR公司来实现的,还是企业自身也能够完成的?
AR系统的搭建和应用需要专业公司提供定制化的服务。因此,在展会、展厅等一些不会有太多、太频繁变化的模型和场景内容中,大多企业能够接受依靠第三方公司开发AR应用支撑业务活动展开的方式。
但是在需要频繁调整更改的工作环境中,企业会担忧AR数据是否能够在内部闭环和数据安全的问题。如果无法形成闭环,不能由企业内部人员进行灵活调整,那么在很多应用场景中,AR系统的推广都将受限于外部成本、响应时间和数据安全因素。
因此我们在企业端的应用需要真正融合企业系统和流程,才能更好地将技术推广应用。从客户的视角来看,客户希望能有自己能够形成闭环的工具,AR公司仅仅提供算法是不够的。
专业AR公司需要提供工具应用和平台的支撑,实现把原有的数据经过组合加工后,就能得到一个全新的AR体验,当上游发生设计更改变动后,企业自己也能灵活更新调整,这样才能为企业客户带来更大的价值和帮助。
在价值的测算上,AR在工业企业的应用更多关注在一线工作人员的应用场景。但其实在过往20年间,企业的IT投资都是放在后端,都是在基于电脑展开工作的信息管理系统、决策支持管理系统中,因此对于一线工作人员工作方式的转变非常有限。
所以我认为AR系统真正意义上的作用是能为企业内占比超过80%的一线工作者带来价值,实际上,我们主要在做的事是将一线人员的工作过程数字化。
目前,工业企业一线人员的工作流程某种程度上是一个黑箱。任务下发之后,中间的标准、合规、安全、结果反馈都是靠人式的方式去控制的,没有使用数字化手段。AR辅助的工作是能将一线人员的工作过程和结果,以及流程进行数字化赋能并可视化,从而实现在每一个时间节点达到工作成果的可测量化。
目前C端移动互联网的发展中,数字化应用其实已经很成熟了,我们希望这种技术可以进一步扩散渗透到企业端一线人员的工作现场,数字化工作过程并且定量地衡量工作价值,更好的进行优化和精益提升。
我非常同意一句话,“AR是面向人的IoT”,人的肉体无法安装传感器,但是可以借助AR和可穿戴设备的方式进行状态的感知和记录,数字化人的行为,聚焦于提升一线人员生产力,从而为企业带来更多价值。
03
AR技术应用的数据来源及安全性
柴代旋:
在智能制造和工业领域,AR技术的应用依赖哪些现实数据?对企业客户来说,数据可得性怎么样?
郭俊玺:
AR技术所依赖的数据是三维模型数据。我们在提到AR时,大家天然地就会将AR和三维模型进行联想,认为AR技术可以投放三维模型,对其进行缩放、平移、旋转。但是应用三维模型的前提是有三维的数据,20年前的工业制造企业使用二维进行设计,现在的离散制造、流程制造等行业的大部分场景都有自己的三维模型数据,这也是企业多年IT信息化的结果。
除此之外,与AR技术所依赖的还有来自于IoT的数据。我们过往的PLM、ERP等信息化系统最大的特点就是把原来物理的执行工作过程数字化、信息化了,里面很多环节的信息、流程数据都已经数字化、可视化了。
支撑起整个AR系统的运行不只是需要三维模型数据,还需要视频、图片、文字的加持,才能使业务场景的应用更加完善,也更利于AR系统的推广。通过AR来展现文字、图像、视频、数据是更加实用的方式,且这些数据获得性相比之下更加便利,毕竟相比三维模型处理,全民写字、拍照、录视频的能力已经不是问题。
举例来说,大部分工业企业都有3D CAD模型,并且随着AI技术的高速发展,用户还可以通过手机拍照的方式完成建模,在后台通过算法生成3D模型,能够在很大程度上减小了三维模型数据的获取难度。
柴代旋:
对于ALVA这类软件和技术类公司,在技术迭代以及底层算法开发和优化过程中,怎么解决训练数据来源的问题?
郭俊玺:
这个问题实际上涉及到AR系统核心的识别算法,以及对应的数据来源问题。
AR识别基础的第一种方式是图像识别,比如我们日常的健康码、二维码是给机器看的,有意义的图像是给人看的,从计算机视觉的角度来看二者本质上都是图像,这种方式是AR实现虚实结合的最基础的方式,是通过图像把数字信息与真实环境做匹配。该类方式的数据来源是图像,这种图像数据的捕获生成技术目前已经比较成熟。
第二种方式是通过平面识别检测的方式,将对应的信息和数据放到平面上。该类方式不需要数据输入,仅靠设备本身的摄像头检测平面和地面,因此有更多、更方便的应用场景。
除了这两种方式之外,我们还在AR识别技术上实现升级和突破。
如刚才所说的,图像、平面都是二维的轮廓形状,而现实物理空间中的物体更多是3D立体的,这就需要我们将传统的计算机视觉技术和AI神经网络技术结合起来,将需识别物体相关的图像数据(如发动机等), 输入神经网络里进行训练,让他能够识别这类物体。
然而在工业场景中,该类技术面临很大的局限性,因为工业场景中的物体图像并不是日常生活中能够频繁见到的,也不是互联网大数据能够采集出来的。
因此,我们在这里做了一个非常具有突破性的扩展——利用AI神经网络和CV计算机视觉的结合,再加上基于工业中常见的3D CAD模型生成大量物体图像数据,训练神经网络实现对实物的识别。图像数据的输入与三维实体模型紧密结合。
也就是说只要有三维模型,就可以通过让机器学习三维模型的图像、训练神经网络,让它变得能够识别实物。但是三维的CAD模型,跟实物之间颜色外观轮廓是有很大差异的,具体的像素显示不一样,因为图片会受到光照、视角等外部因素的影响。
目前我们通过模型识别的算法,识别三维CAD模型的关键轮廓,提取本质特征,从一个三维模型里提取几千、上万张不同视角的图像,再把图像喂到神经网络里训练识别算法,这样它就能够识别实物。并且,只要在形状上一致,就算颜色、材质、光照有所变化,神经网络都能识别成功。
还有一种方式是空间识别,比如人处于办公室或者车间里,在来回走动时,手机、眼镜移动端的AR应用就能识别出人在车间的精确位置,并且识别的精度精确到厘米级。
这种精度可以达到在空间任意位置上放置一个虚拟的模型,与真实的物品进行叠加时,人眼在视觉上看不出明显偏差。这种方式类似激光扫描相机的应用,需要提前对整个空间环境进行数字化的三维建模,从而精准快速的判断人所处的位置和朝向。
柴代旋:
数据来源在同行业中的复用性是怎样的?客户是否会介意零部件、技术的保密性?是否会对后续工作产生影响?
郭俊玺:
为了降低AR系统的内容成本,在实际工作中不可能针对每个模型、设备都重新建模。在一些工业领域内,实物模型是标准化的,如发动机,同型号的发动机可能适配多个汽车厂,因此只要上游发动机厂家提供三维数据做应用和呈现,是可以直接提供给下游汽车厂复用。
同时这里涉及到知识产权保密的问题,但是因为我们主要是为了呈现外观层面的数据,而不是精细的设计核心数据,所以大部分厂家相对愿意分享。此外,我们在客户企业内部应用AR系统的时候,企业自身也会有标准化的通用件,能够用来搭建AR模型库,从而降低模型获取成本。
客户在接受AR系统解决方案时会考虑到涉及安全性的问题,我们只是需要对物体外观模型做一些呈现和展示,并不是需要核心设计数据,这类模型对企业来讲基本是脱敏的,但毕竟还是会受到知识产权和隐私保护的限制。因此最理想的方式是由类似ALVA这种专业的AR公司提供制作工具,让客户自身形成闭环,这种情况下就不存在数据的安全问题和外泄隐忧。
04
异构计算发展进一步推动AR应用变革
柴代旋:
HC异构计算技术可以为AR技术以及应用带来哪些价值提升?(是否有典型的案例对比或者定量的数据介绍?)HC异构计算技术的壁垒在何处?ALVA是如何建立起自己在这方面的护城河?
郭俊玺:
异构计算的概念是把计算任务的不同部分分配给不同的计算节点去完成,比如电脑有CPU和GPU,甚至HPU(全息处理器),如微软Hololens眼镜中就有芯片专门用来进行视觉计算,以及FPGA(现场可编程逻辑门阵列)专门进行深度学习的神经网络训练等。
由于每个节点的类型、计算效率不同,因此异构计算能够进行计算任务的分配,最高效地完成整个计算过程。原来的静态计算模式有很大的滞后性,可能是任务下达很长时间之后才能得出计算结果进行决策参考。
目前,AR的计算是实时的,理想的应用效果需要在20毫秒甚至更短的时间以内就可以反馈计算结果,将原来的计算效率进行了极大的提升。异构计算使用专门的计算单元,每个计算单元进行的某一种类型的计算速度很快,最大限度地利用各个计算单元,可以实现在原来基础上几百、上千倍数的计算速度提升,大幅提高整个计算效率。
我们目前的设备端形态的变化,也催化异构计算的进一步发展。从PC端到手机移动端到眼镜穿戴设备,设备的体积越来越小,功耗也越来越少。曾经我们的电脑功耗在100瓦量级,手机功耗在10瓦量级。但是理想的AR眼镜是功耗在1瓦的量级,因为要保证待机时间和使用时长,并且要在这个条件下实现高效的实时交互计算,此时原来的软件算法的计算架构就不能满足要求,必须要借助异构计算的方式来完成整个计算速度和计算效率的提升。
举个例子,在2018年,物体目标检测算法在配置Intel i7处理器但没有专门GPU的电脑上识别一帧图像并且提取特征需要4.9秒。如果在AR的实际应用里,这样的速度是不可行的,因为AR是实时刷新的,一秒钟有50-60帧甚至更高的刷新频率,比如我们电视电影每秒有24-30帧画面,但由于AR是立体的,左右眼图像是不一样的,所以我们的画面帧数要达到60帧。又因为AR眼镜是近眼显示,会更容易产生画面闪烁和纱窗效应,所以我们的刷新率要达到120帧/秒。这相当于一帧画面是8毫秒,和原来的4.9秒(4900毫秒)相去甚远,而且这是在电脑CPU的算力。
所以如果我们将这种算法转置到移动端、眼镜上需要更高的算力和更低的功耗,也更要求计算效率的大幅提升。同时,眼镜的功耗大约是手机的十分之一,电脑的百分之一,目前的HoloLens 2由于装配了HPU,能够在8瓦的低功耗条件下进行较大的任务计算,从而可以看出,异构计算带来的价值提升主要是在降低功耗和增大计算效率上。
异构计算的壁垒主要涉及到计算效率提升的本质。第一是硬件,在于芯片的计算能力是否合格,主频是否高。其次,计算的过程中不仅涉及到计算,还涉及数据的传输,把数据从硬盘上读取到缓存中的方式也会影响计算效率。
我们以一次浮点运算为例,在电脑CPU上进行一次加法运算需要消耗0.9pJ(皮焦耳,10-12焦耳),假设延迟是一个时钟周期,如果需要去缓存里访问这个数据,需要20pJ、5个时钟周期,到那时如果是内存访问,则需要1,600pJ、422个时钟周期,功耗相差了130倍,如果需要在硬盘里访问这个数据,能耗比会更大。
因此可以看到,在缓存、内存、硬盘里提取数据,计算的效率和功耗相差了非常显著的量级。所以可以得出结论,软件和硬件都同等重要,不同的软硬件计算、数据存储方法都会导致计算效率的巨大差异,因此我们需要把软硬件结合起来。虽然硬件计算速度差异巨大,但是可以通过软件来提高数据的缓存命中率,同时降低算法的计算复杂度,提高计算效率。
这也是异构计算的壁垒所在——它紧密地结合了硬件、芯片底层的架构、内部数据的计算能力、传输能力、上层算法的能力,从而提升计算效率,解决计算任务。
我认为ALVA的优势主要在两个方面,一个是人才,因为公司创始团队来自Intel、AMD、微软等国际知名企业,创始人曾经任职英特尔芯片架构优化,天然地对芯片具有深厚的理解,比如刚才提到的芯片底层数据的传输、各个计算单元的的整合;以及公司与高通、Intel、AMD的合作在算法函数上赋能芯片,让芯片的计算速度更快、计算过程更高效。
因此对于芯片底层的深厚理解和高端的业内人才是ALVA的重要优势。此外,ALVA的计算能力以及和AR技术的整合已经有十余年的历史,可以说“十年磨一剑”。ALVA在十年的时间里致力于研究如何将异构计算和AR应用做更好的融合,积累了丰富的经验和经历,可以说我们具备了很强的先发优势。不仅如此,ALVA在软硬件结合方面也已经达到炉火纯青的地步。
柴代旋:
未来AI+AR软件和算法的算力需求会有多大的提升?是否会受AR硬件可提供的算力限制?
郭俊玺:
未来随着技术的持续发展,AI+AR算力需求会大幅提升。因为画面像素越来越高,人眼能够感知到比较精细的画面像素分辨率在10k左右。人的单眼视野范围为160°,每度为60弧分,因此10k的画面像素数量是效果比较理想的。但是10k相比1k的计算量级是百倍以上的提升,数据量也大大增加。因此当需要识别的数据量过于巨大时,AR硬件本身的算力就遭遇瓶颈。
目前已经有了相应的解决方案,首先就是硬件本身在大幅提升,目前硬件已经从14nm缩小到5nm,甚至3nm,这种提升能够部分解决问题。但是在大数量级的变化时,单凭本地硬件算力的提升还远远不够,还需要借助异构计算实现更大范围的任务分配。
与5G结合的云端服务器也是一个解决方案,但是上云面临着较大的延迟问题,因为光线在传输信号的时,如果距离较长,可能会需要更多时间返回信号。因此如果客户对实时要求高,我们就需要把计算能力部署在更靠近使用端的边缘服务器上。
05
AR技术与应用可能面对的挑战
柴代旋:
从您的视角看,目前阶段的AR应用到实现企业数字孪生,甚至到工业元宇宙,可能会存在哪些发展瓶颈?
郭俊玺:
AR既然是一种新技术,我们首先要构建一套新的应用模式,也就是刚才所说的虚实结合——将数字信息和真实环境结合的技术和能力,再探讨实用的场景、工作类型、应用模式。
打个比方,就好像我们有了马克思主义的理论指导,在此基础上构建了社会主义国家,也就是说我们现在需要搭建模式思路,再去实践落地解决实际问题。但是谁在探索这个模式呢?模式如何与工业场景紧密结合呢?这是其中的一个发展瓶颈。
其次AR是下游应用,因为AR是企业数字化转型的手段,因此如果企业本身只使用物理的手段,比如纸质化图纸。那么AR的作用会大打折扣,因为AR的作用在于数字化呈现并利用信息,但是如果本身没有数字载体,就没有数字主线,就没有数字孪生,那么AR如何发挥作用呢?因此AR的作用程度也取决于企业目前的数字化转型的发展程度。
在技术上,如何实现高精度的定位也是影响AR应用发展的因素。一般来说,GPS定位可以达到几米级的误差,开车的时候还是可以应用,但是在AR体验上,眼睛对误差的感知是厘米级的。这种程度的精确定位需要一种新的技术手段,包括和5G的结合,也是行业亟须解决的问题。目前已经有国际标准组织在建立结合经纬度坐标的绝对位置标准体系GeoPose,相信在将来会作为一种基础设施级的能力提供给上层广泛的应用软件来使用。
从数据管理的角度来看,数据库也需要一种新的管理模式,因为在AR应用中,包含了时间、空间的因素,处理数据表的时候需要将其纳入考虑范畴,类似时空数据库的概念。新的应用模式正在影响整个AR技术在企业实际落地、普及、推广发展的进程。
06
国内主要的AR厂商布局情况
柴代旋:
目前国内市场中,工业AR厂商主要有哪些类别?相比而言,ALVA作为本土AR软件和技术服务提供商,在技术以及业务层面分别有哪些竞争优势?
郭俊玺:
相比之下,国内的AR公司很多的以AR眼镜为切入点展开业务,更多以硬件为主。但是ALVA是以纯软件算法为主的,不局限于自身的硬件,所以我们能够在业务上保留适配市面上最好硬件的灵活性,为自己,同时也为客户提供选择权。
从AR眼镜的市场成熟度来看,目前这类产品也尚处于早期的市场阶段。我个人的观点上来说,我认为AR眼镜是“大厂的生意”,因为市场规模是足够大的,巨头公司都在虎视眈眈地盯着这块市场的蛋糕。但是微软、苹果、谷歌这类公司之所以迟迟不下场去做,也是因为他们判断这块市场的成熟度还没有达到成熟的标准。可以说,一旦这块市场达到了“成熟”的临界点,互联网巨头一定会纷纷入场。
在技术方面,ALVA的模型识别、空间识别、平面识别的算法目前在国内位居第一,我们在全球范围内对标美国的PTC公司。对终端客户来讲,算法等技术层面的能力并无裨益,他们更需要的是实用的产品和工具,能够打造形成自己的业务闭环,能够利用算法完成自身的业务活动。
在此层面上,在多年的发展的基础上,ALVA也封装了远程协助产品、AR内容编辑工具等标准化应用软件,也就是让AR与工业实际场景结合。这并不是技术上的难题,而是一个对新模式的探讨,因此我们现在也基于新模式搭建架构和平台。同时,ALVA很多员工都是有工业从业的背景,对于工业如何AR技术结合也有很深的理解。
在产业合作方面,ALVA积极与清华、西安交大、AMD、英特尔等一流高校、国际企业合作,深耕国内业务的发展。相比之下PTC作为美国公司,在开展中国业务时会受到一些阻力,目前看来该公司的产品都是基于公有云的SaaS化产品开展业务。
这里引出我们另外的一点优势,就是国际化的视野,虽然ALVA是一个本土公司,但是我们的视野相对来讲更为开阔,因为我们外部链接合作了很多国际知名公司,如西门子、Rockwell等,他们帮助我们了解最新的技术发展趋势,探讨行业标杆客户的应用场景和模式。
此外,ALVA是聚焦在AR在工业领域应用和落地的,因此企业的销售团队、技术团队都聚焦在工业客户,也在这个领域积累了行业认知和客户资源。因为工业有较高的行业壁垒,有更复杂的作业环境、更慢的行业迭代周期,因此如果互联网头部公司想进军该领域,可能会面临着较高的沟通成本,而这恰恰能成为ALVA的优势。