草庐IT

真·3D创作来了,必须用手比划!这回AI总不能抢我饭碗了吧

QbitAl 2023-04-03 原文
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

AR苦内容久矣。

过去一段时间来,AR厂商们都争相推出消费级AR眼镜,在重量、续航、功能上卷出新花样,但也逃不脱被人们诟病:

除了看片还能干啥?

当下的消费级AR到底是不是真·AR?

对于用户来说,AR眼镜的作用,如果只是将一台投影仪缩小到镜片大小架在眼前,很难长期满足消费者不断涌现的新需求。

一直和手机借内容生态?

似乎也不可取,毕竟AR最大的想象力就在于如何成为一个新型独立终端。更何况手机内容都局限在2D,和增强现实基本定义里反复提及的3D也有本质性区别。

所以应该怎么办?

卖空自家6万台AR眼镜库存的行业头部玩家,最近顶着元宇宙退潮交出了自家答卷:

通过一个AR应用,他们让普通人在10分钟内建造属于自己的AR数字空间。

而且还是必须要用手在物理空间里创作的那种,AI这回没话说了吧?

当然这是开玩笑,其背后真正的目的在于,能够让更多开发者、创作者,能够来AR空间内发挥自己的想象力,壮大AR内容生态,并进一步达到推动AR向大众层面渗透。

所以这款应用到底是什么?仅凭它就能实现如此宏大的目标吗?背后又揭示了AR行业的哪些暗涌?

灵境是什么?

Rokid创始人兼CEO 祝铭明表示,灵境是AR行业一个划时代的产品,可以让每一个人都参与到AR数字内容的创作中。

官方定义,灵境是一款AR空间创作工具,能做的事就是在3D空间内创作AR内容,而且门槛很低,人人可用。

具体操作步骤分为5步:

  • 手机扫描空间

  • 云端空间重建

  • 在线场景布局

  • 多端一键发布

  • AR终端体验

也就是说,通过普通手机摄像头,灵境就能获取到空间信息,然后在云端进行重建。之后就可以按照自己的想法完成创作了。

创作好的AR内容可以直接发布在平台上,一个空间内可以有多个人发布自己的创作。最后只需戴上AR眼镜就能体验。

整个过程下来,一个10平米左右的空间,只需10分钟就能搞定。

据介绍,灵境的内容渲染也是基于Rokid自己的3D渲染引擎,这样可以极大降低整个内容创作、落地的时间和人力成本。

要知道,目前AR内容创作的落地过程,基本上都还是一个长链条流程。

需要有一定的产品资源、开发资源和内容创作资源,然后再由专业团队打包资源到现场测试,最后进行验收。常被使用的创作工具如Unity、UnrealEngine,在使用上也有门槛,要求用户具备一定的开发基础能力。

而且灵境还强调一大特点:协同合作

不仅实现了多端一致,即在手机、PC、AR眼镜上都能看到创作内容空间;也实现了让多人参与到同一空间内的AR创作。

这个定位明显更偏向于大众化,行业内用户和普通消费者都能上手体验,与此同时也会提出一些新的要求,如高并发需求、终端算力、内容创作效果等。

那么问题来了——

灵境是如何实现的?

这背后其实是一整套技术栈的全方位升级,包括硬件、系统、云服务、算法等。

首先来看硬件方面,这一次配合灵境的发布,Rokid将AR眼镜从传统“双鱼眼+RGB三摄方案”升级为“单摄RGB轻量化SLAM”。

单目方案的好处很直接:结构简单、硬件设计复杂度降低、主板面积小、成本功耗比大幅降低,用户侧能直接感受到佩戴舒适度和续航能力上的提升。

在落地应用上,据悉灵境搭载的硬件也是只有一个摄像头的。

因为把相机数量压缩到最后一个,单目方案可以带来更低功耗更简结构,更低成本等诸多优势,舒适的佩戴和更普惠的价格,符合灵境的“让AR更普惠”的需求。

但单目方案也确实有短板,比如它无法得到绝对的尺度信息,所以需要通过初始化恢复尺度信息,而初始化的好坏直接影响算法最终的精度。单目计算绝对尺度准确性不够高,尺度收敛也有不确定性,这些对单目SLAM算法开发带来很大的挑战,会直接影响到AR体验。

不过Rokid表示,目前行业内已经出现了相应的解决方案。

算法上,在IMU的辅助下,单目的静态初始化和动态初始化已经有了很多方案,初始化完毕以后基本上获得比较精确的绝对尺度先验。再结合比如基于滤波的算法,可以在后期使用过程中对各种SLAM参数持续优化,进一步提升算法的定位精度,同时基于深度学习的技术在SLAM算法上也有很多技术探索。

由此,也能感受到Rokid的理念是:AR产品不仅仅只是堆叠传感器,而是软件、硬件、算法和场景作为整体,给用户提供更舒适的AR综合体验。

软件方面的提升,主要体现在3D点云和SLAM方面。

并利用端云协同的方式平衡了算力、功耗和高并发几个方面的要求。

Rokid应用平台中心部门负责人Watson介绍说:

基于3D点云的视觉定位技术和设备端的SLAM技术(Simultaneous localization and mapping,同步定位和地图构建),可以类比自动驾驶中的道路高精地图和车辆空间感知。

在AR场景下,也有一些开发者拿点云作全局的粗定位,拿SLAM做局部精定位,两个松耦合在一起。

Rokid这次将这个松耦合,做了更深度的融合。实现了端上只做定位和跟踪,云上空间建图。

这种端云协同协作计算的方式,可以提升一些场景下的定位精度,如弱纹理、环境有变化的场景,同时也能降低移动端的计算功率。原理上主要利用了RTC(Real time communication,实时通信)在弱网对抗/低时延传输和视频图像压缩上具备的优势。

紧耦合的实现,依靠了Rokid全新升级的底层操作系统YodaOS-Master

具体变化体现在XR系统、XR云服务和XR硬件三个层面。

系统全方位升级后,Rokid可以搭建一个更加完整闭环的OS生态,以此更好连接开发者和消费者。

深扒完灵境的技术栈后不难发现,Rokid此次发布是有备而来。

最核心的目的十分明确:降低AR内容创作门槛,壮大AR内容创作队伍。

仅需一部手机即可体验,耗时缩短到10分钟,这确实是每个人几乎都能满足的条件,还有机会感受到所谓“真正的AR”到底是什么形态。想一想,确实能吸引一波好奇者了。

由此也让人开始好奇,为什么要在此刻正式推出灵境?又为什么要主打降门槛?

答案还是要从市场需求、AR行业发展及行业玩家经验验证几个维度看起。

为什么要做灵境?

最直接的影响因素还是来自于市场需求

Rokid副总裁、数字文化事业部负责人陈希表示,目前在文博文旅领域,对AR内容的需求非常突出,她给出了一个很惊人的数据来说明:

今年春节期间在文博场景体验过Rokid AR的人数达到了4万人

全国范围内,如广东省博物馆、西安博物院、陕西自然博物馆、苏州博物馆、良渚古城遗址公园等都陆续推出了AR导览。

AR会在文博领域快速渗透的原因也很好理解,它能极大程度上丰富3D空间内的内容丰富度,并将文化知识以更加直观、丰富、多样的方式呈现到参观者面前。

而全国登记在册的博物馆数量就超过了6000家,随着越来越多博物馆提出需求,过去长链条的内容生产模式,难以快速响应。更何况这种以方案落地的模式,对人力物力成本的要求也很高。

因此,市场上亟需一个能高效易上手的生产力工具,能够加速AR内容的创作,并降低成本。

另一边,在工业方面类似的情况。

Rokid副总裁、产品技术中心负责人江涛介绍说,和文博场景有些相似,在工业生产一线上,也希望能够在3D空间里尽可能展示更多信息。

这样一线人员进行操作时,不用再专门走到一些仪表前查看数据、核对情况,而是直接在工作现场就能看到所需信息。

用江涛的话来说,从工业元宇宙的大概念出发,完成数字化转型是做完了工业元宇宙的基建,将整合分析好的数据再重新反馈到现场,才真正走完了一整个闭环。

由于工业场景天然对降本增效提出更高要求,因此工业场景内AR的需求和市场可能会更大。

在很多工厂中,许多条真实的AR生产线已经被搭起来了:

此外,在教育领域,用上AR辅助教学也逐渐普及开来。

比如基于AR的安防教育,就不再只是书面、视频形式的灌输了。小朋友们可以在模拟的火灾场景里学习如何逃生,记忆点会更加深刻,教育的效果自然也会更好。

而在这一场景内,学校老师往往是需要基于课程要求,持续更新AR内容的,一个基于手机就能用的低门槛内容生产工具,也确实符合真实需求。

如上是市场方面带来的直接需求。

更深层的影响因素,是AR现阶段进化的要求。

一直以来,AR原生内容生态匮乏都常常被人吐槽,成为很多人不愿意体验AR设备的一大原因。

和手机借生态?虽然内容丰富度短期上来了,但是展现的内容更多局限在2D层面,真正的AR内容没有被展现出来,还会让人觉得AR眼镜的终途就是手机配件?

由此,对于AR行业而言,几乎所有人都意识到丰富内容生态是当下发展的重中之重。如苹果在最早期探索AR时,也是率先发布了AR Kit开发平台,把APP Store的打法继续用在AR领域。

毕竟只有内容丰富了,用户才会被吸引过来,AR才有机会向前更进一步。那么眼下的问题就变成了如何丰富AR原生内容。

仅凭AR厂商一己之力显然效率不够高,过去多年来探索出的AR交互场景还是非常有限。

号召更多开发者和创作者加入,正在逐渐成为行业内的共识,并且要把使用门槛和成本都打下来。

由此也就不难理解,作为行业内的资深玩家,Rokid选择推出灵境这样一个AR空间引擎。

但,为什么是现在?

Rokid给出的回答是:自身在文博领域的经验积累,验证了市场对于AR的真实需求。

陈希回忆起最初和良渚古城遗址公园的合作时,各种场景还历历在目。

她记得当Rokid和园方提出,可以利用AR来对文物遗址进行修复时,园方立刻表示很感兴趣。整个项目从最初提出到落地,前后经历了3个月左右,最终在2020年国庆期间和大众见面。

最开始,Rokid一天提供了200副AR眼镜的租赁,结果一个小时左右设备就全被租出了。并且对AR好奇的人群,很多都是老人和小孩,这也出乎了Rokid的预料。

而有了真实场景的应用,其实能从第一线积累到非常宝贵的开发经验。比如在设想里人们都会按照导览顺序参观,但实际不是如此,Rokid就要保证乱序参观也不会影响AR效果的展现。以及针对博物馆室内灯光条件不好的情况,技术团队也专门做了优化……最终这些优化和迭代,一并体现在了灵境的设计里。

陈希也感慨说,不可否认当下还不是所有人都愿意花上千元去购买一个专门的设备来体验AR,但是如果只花50块钱通过租借,是很多人都愿意尝试的

那么等到未来,应用场景足够多时,价值就会慢慢体现,那个时候可能就到了AR真正走向C端的时刻。

由此也就不难理解,为什么灵境会在此刻推出。

因为它能通过一个小杠杆,撬动庞大的开发者和创作者群体,发动数以百计、数以千计的人,共同探索广阔的AR内容和应用场景。

并以此助推AR更快速走向大众群体,成长为真正意义上的下一代移动计算终端设备。

灵境会带来什么?

作为一款AR原生内容生产力工具,灵境的出现向行业内外传递了一个信号:

是时候发展AR的内容生态了。

并且不再是和手机或其他终端借生态,而是从AR自身出发,能够展示“什么叫真正的AR”。

一方面,参考目前移动计算终端的绝对霸主智能手机,它正是在出现了爆款内容应用后,才快速吸引了大量用户。

另一方面,AR原生内容和手机等终端内容有本质性区别,它需要是3D的

如果一直和手机借生态,那最终大众对于AR的理解,可能只是手机的虚拟大屏,这会限制整个技术和产业发展的想象力,也会影响AR的独立发展。

由此,开发AR原生内容是当下必须做的事。

尽管目前在算力、硬件等条件的制约下,AR内容还无法一下达到大家的最终期待。但诚如Windows最初,不也是只有扫雷、蜘蛛纸牌这样的简单应用吗?

我们需要给予技术足够的耐心,等待变化发生。

更何况,端云一体的思路,确实为解决当下算力问题提供了新解法。

如果再从AR行业外的角度来看,灵境的出现也为广大开发者和创作者提供了一个新的机遇。毕竟每一代移动计算终端的崛起,都会伴随一大批非常优秀的内容应用和软件涌现。

总之,在AR向前推进的这条路上。还会不断有新的行业角色、技术力量加入进来,共同推动AR驶向我们的终极想象:真正意义上面向大众的增强现实。

你觉得呢?

—  —

点这里👇关注我,记得标星哦~

有关真·3D创作来了,必须用手比划!这回AI总不能抢我饭碗了吧的更多相关文章

  1. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  2. FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2

    本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01  客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02  数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit

  3. Unity 3D 制作开关门动画,旋转门制作,推拉门制作,门把手动画制作 - 2

    Unity自动旋转动画1.开门需要门把手先动,门再动2.关门需要门先动,门把手再动3.中途播放过程中不可以再次进行操作觉得太复杂?查看我的文章开关门简易进阶版效果:如果这个门可以直接打开的话,就不需要放置"门把手"如果门把手还有钥匙需要旋转,那就可以把钥匙放在门把手的"门把手",理论上是可以无限套娃的可调整参数有:角度,反向,轴向,速度运行时点击Test进行测试自己写的代码比较垃圾,命名与结构比较拉,高手轻点喷,新手有类似的需求可以拿去做参考上代码usingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;u

  4. [Vuforia]二.3D物体识别 - 2

    之前说过10之后的版本没有3dScan了,所以还是9.8的版本或者之前更早的版本。 3d物体扫描需要先下载扫描的APK进行扫面。首先要在手机上装一个扫描程序,扫描现实中的三维物体,然后上传高通官网,在下载成UnityPackage类型让Unity能够使用这个扫描程序可以从高通官网上进行下载,是一个安卓程序。点到Tools往下滑,找到VuforiaObjectScanner下载后解压数据线连接手机,将apk文件拷入手机安装然后刚才解压文件中的Media文件夹打开,两个PDF图打印第一张A4-ObjectScanningTarget.pdf,主要是用来辅助扫描的。好了,接下来就是扫描三维物体。将瓶

  5. ruby - 为什么不能使用类IO的实例方法noecho? - 2

    print"Enteryourpassword:"pass=STDIN.noecho(&:gets)puts"Yourpasswordis#{pass}!"输出:Enteryourpassword:input.rb:2:in`':undefinedmethod`noecho'for#>(NoMethodError) 最佳答案 一开始require'io/console'后来的Ruby1.9.3 关于ruby-为什么不能使用类IO的实例方法noecho?,我们在StackOverflow上

  6. ruby-on-rails - Ruby rand() 不能接受变量? - 2

    我对此有点困惑。我在RoR项目中的最终目标是从我的数据库中获取单个随机配置文件。我想它应该是这样的:@profile=Profile.find_by_user_id(rand(User.count))它一直抛出错误,因为user_id0不存在,所以我把它的一部分拿出来检查发生了什么:@r=rand(User.count)每次都返回0。发生什么了?我注册了5个假用户和5个相关配置文件来测试这个。如果我将Profile.find_by_user_id(rand(User.count))重写为Profile.find_by_user_id(3)它工作得很好。User.count也在工作。所以

  7. ruby - 为什么我不能从 ruby​​ 中的选定键创建新的散列? - 2

    这个问题困扰了我一段时间。这不是一件困难的事情,但我不知道为什么没有简单的方法来做到这一点,我敢打赌有但我没有看到。我只想取一个散列,像这样:cars={:bob=>'Pontiac',:fred=>'Chrysler',:lisa=>'Cadillac',:mary=>'Jaguar'}然后做类似的事情cars[:bob,:lisa]得到{:bob=>'Pontiac',:lisa=>'Cadillac'}我这样做了,效果很好:classHashdefpick(*keys)Hash[select{|k,v|keys.include?(k)}]endendruby-1.8.7-p249

  8. ruby - 为什么必须明确指定 2 个参数才能 curry :> - 2

    考虑这个,它工作正常::>.to_proc.curry(2)[9][8]#=>true,because9>8然而,即使>是一个二元运算符,如果没有指定的元数,上面的代码将无法工作::>.to_proc.curry[9][8]#=>ArgumentError:wrongnumberofarguments(0for1)为什么两者不等价?注意:我特别想用提供的一个参数创建中间柯里化(Currying)函数,然后然后调用然后用第二个参数调用它。 最佳答案 curry必须知道传入的过程的数量,对吧?:-1来自arity的负值令人困惑,但基本上

  9. ruby-on-rails - 为什么 Rails 可以使用 `if` 作为哈希键但在 Ruby 中不能 - 2

    在纯Rubyirb中,不能输入{if:1}。该语句不会终止,因为irb认为if不是符号,而是if语句的开始。那么为什么Rails可以有before_filter接受if作为参数?该指南的代码如下:classOrderunless也会发生同样的事情。 最佳答案 这是一个irb问题,而不是Ruby。bash=>ruby-e"puts({if:1})"bash=#{:if=>1}您可以改用pry。它将正确读取输入。https://github.com/pry/pry 关于ruby-on-rai

  10. ruby-on-rails - 为什么用户必须输入 7 位数的 Twitter PIN 才能授予我的应用程序访问权限? - 2

    我正在为我的用户实现一些ruby​​onrails代码推特内容。我正在创建正确的oauth链接...类似http://twitter.com/oauth/authorize?oauth_token=y2RkuftYAEkbEuIF7zKMuzWN30O2XxM8U9j0egtzKv但在我的测试帐户授予对twitter的访问权限后,它会弹出一个页面,上面写着“您已成功授予对.我不知道用户应该在哪里输入此PIN以及他们为什么必须这样做。我认为这不是必要的步骤。Twitter应该将用户重定向到我在应用程序设置中提供的回调URL。有谁知道为什么会这样?更新我找到了thisarticle声明我需

随机推荐