XR迈向10亿级必须解决的3个问题
XR行业在发展过程中,还存在着哪些亟待解决的问题?可能在人机交互、操作系统、颠覆力度等维度上,XR行业和相关企业还需继续投入和发力,这也是XR想迈向“10亿级”过程中需解决的重要问题。一起来看看作者的分析与解读。
最近一年经济下行,包括Meta在内的多家XR大厂都传出裁员收缩的消息。笔者开始试着思考一个问题:如果换作我来做XR,在资金和人力不再充裕,但是至少还能保证有一定持续性投入的情况下,我会怎么做?
在决定研发投入之前,首先需要认清一点:现在XR处在什么阶段,哪些是核心待解决的问题。
如果一个产业或商业模式的核心问题已经解决得比较好了,那就表明它已经成熟了,后来的入局者也就没有太多机会——现在的手机市场就是这种情况。所以大家才会期待XR有颠覆性创新,开辟另外一个市场。但是目前VR的发展其实也不算太好,有很多人认为是VR平台上的优质内容还不够丰富,限制了VR设备的销量。
但我却不这么认为。
待解决问题1:人机交互 笔者认为,是人机交互限制了XR的发展,而不是内容。
无论XR的前景吹得多高,只要文本输入等人机交互没有持续突破,当前世代VR设备的市场就不会超脱出游戏机的市场。因为它们都是输入方式很低效的娱乐设备。
Meta Quest 2在很短的时间里就做到了千万的量级,如果对标游戏主机市场,已经非常成功的PlayStation 4和Nintendo Switch在本世代数年累计下来的销量分别是1.17亿台和1.18亿台。Quest距离游戏主机的天花板并不算遥远,而手机市场则是每年10亿的量级。
图源:网络
手机作为个人终端设备,其实并不需要很强的文本输入方式。触摸显示屏的虚拟键盘只能算刚好够用,也不太能拿去做生产力。但现阶段XR设备的文本输入连手机的体验都达不到,只比游戏手柄好一点。无论是射线交互还是基于视觉识别的裸手点击键盘都有很致命的问题,而语音已经在手机和平板上验证过,是一个比较偏门的输入方式。
目前看,最有可能把XR输入推到到临界点的方案是以肌电手环为核心的多模态交互方案,可能会做到手表上。另外还有“非侵入式脑机接口+眼动识别”也是一个补充方案,脑机接口还会带来更颠覆性的人机交互创新,它可以做到镜腿上,但是它们都还没有产品化。所以说在XR领域里,类似PC领域的鼠标以及类似手机领域的触摸显示屏和物理定位这种核心交互技术还没有出现,导致它无法进入10亿销量俱乐部。
如果你接受的说法是内容大作登陆VR平台就会引爆市场,那其实是游戏机的打法。而且该观点默认本世代的VR人机交互的基础已经完备,平台的价值就是用于娱乐内容。那可以大力攒内容,攒独占内容。这个生意不是说不能做,但是其天花板就是游戏主机的天花板,而且确实存在“鸡生蛋、蛋生鸡”的问题。游戏主机的经验就是用超高的预算投资到内容,包括第一方和第三方。这非常考验财力以及对游戏行业的理解和沉淀,而且厂商的大部分精力是花在怎么搞内容上。
如果你接受的说法是革命性的人机交互方式、机器学习等技术推动XR的综合体验远远超越手机,形成新的个人终端浪潮,那其实是操作系统的打法。现在根本不需要投入多少资金在内容起飞上。有革命性的平台,自然有纷至沓来的用户和开发者。就像手机里有定位以后,滴滴、美团自然就出现了。XR现在的问题就是还不够革命性,而厂商的大部分精力应该要放在技术判断上,避免在错误的技术路线上浪费时间,导致错失窗口期。而当临界产品上市时,应用市场里最先火起来的甚至既不是游戏、也不是影视。
回到前言的那个问题里,如果资金不太充裕但是可持续投入的话,我一定会选择后者的打法。
待解决问题2:操作系统 类似Quest 2这样的操作系统远远没有达到XR该有的样子,从用户体验上来讲,它唯一能做到事情就是打开另外一个独占应用,俗称Launch。
Quest除了第一方的少数几个App是非独占式应用,例如浏览器,其他所有的App都是独占式的,它们运行在一个封闭的3D引擎里。甚至连主控室这样一个接近桌面概念、Home概念的应用也是一个独占而封闭的应用,而那几个可怜的非独占式应用还是2D贴片,本质上是一个Android的Activity。
目前没有一个操作系统能承接复数个3D形态且是非独占式的应用。这点至关重要,如果做不出来,那实际上只发挥出XR平台6DoF特性30%的潜力,还有70%够不着。
图源:网络
过去两个应用之间如果要通信的话,必须通过网络服务器或者获得操作系统的一些权限,大家提前约定好接口协议。我们一直习惯这个软件开发的做法,但是在基于物理的现实世界里并不是这样的。用户穿着Nike的鞋子一样能走在宜家盖的商场里,不需要约定关于地面和鞋子摩擦力的接口;汽车能开在宽阔平坦的道路上,无论是哪个汽车品牌、哪个基建公司以任何标准铺的路。因为它们有更基础的一套物理规则已经把很多接口都约定好了,或者说有更基础的一套规则,能让无数的现象和体验能涌现出来。
如果有一个在“3D引擎之上的3D引擎”,它能让两个3D应用或者不同的3D引擎在操作系统层面共存或者共享一些3D的基本信息和规则,就能激发出非常多的具体用法,这就是那70%。而这里面暗藏着多大的机会,目前应该有很多人是想象不到也不会相信的。
之所以说操作系统制霸科技行业,容易形成垄断,因为有大量用户在上面,大量开发者也基于操作系统开发软件服务。而“操作系统”的具体形态在不同的时代是会变化的。
互联网时代的操作系统是浏览器,用户的大量集中在网站上,而浏览器能轻易地分发自己想分发的东西。社交网络时代的操作系统是小程序平台,因为用户大量聚集在社交网络上。Facebook的开放平台以及微信整个体系就是要吃“操作系统”这口饭的。移动互联网iOS和Android这样的操作系统又带走了手机App的生态,制衡着Facebook和微信的生态。甚至是OPPO、vivo这样处在中游的厂商,其利润中非硬件的互联网服务部分大概到2016年左右就过半了,他们只要维持住自家设备的日活就能赚到钱。
Meta做Horizon Worlds想吃的那口饭和它在Facebook时代做开放平台是一样的,把用户和开发者、创作者聚到一个元宇宙里。但是Meta选择基于Native的一个特定的3D引擎里来做,个人认为这是步臭棋。Meta其实有机会做一个真操作系统,这样就有机会达到Google和Apple的地位,但是它没有。也可以基于WebXR来做,这样开放性会更高,至少能维持住自己在上一个时代的地位,但Meta做得太慢,看起来没有投入太多资源。
Horizon Worlds负责人的离职可能暗示着Meta的技术路径选错了,去年引发热议的那几张矬照肯定不是最直接的原因。PICO 的轻世界其实也有类似的风险。这样的Horizon只能去和VRChat、Rec Room、Roblox甚至未来的米哈游竞争,Meta把Oculus买到手后却又自己放弃了与Google、Apple的竞争的机会,也可能它使用的是Android,不敢和Google竞争。
我认为最有可能成就“操作系统”的是WebXR相关的技术栈,因为大量的服务都要上云,也符合SaaS的趋势,用WebXR最容易兼容不同领域开发者的3D化需求。但是WebXR有一个缺点,就是基建太落后,与Unity、Unreal这种商业引擎差太远了。而且它现阶段很依赖开源社区贡献,目前XR开源项目太少,质量太低。我在2021年用WebXR做东西,压根凑不齐一个Unity最基础的功能,更不要说别的。总之这个领域目前看还转不起来,可能也是Meta不想投入太多的原因。
图源:网络
另一个很接近的是Unity,但是Unity没有动力去做一个“Unity之上的Unity”,为的只是兼容其他竞争对手。其商业模式决定了要让开发者使用它的引擎服务,而不是向消费者做分发。除非Unity的广告业务能做起来,令商业模式发生变革,否则大概率的做法还是把自家引擎服务做好收钱。它有一个Unity Store,不过那只是一个“开发者to开发者”的生意,没有大众消费者就到不了“操作系统”。
Epic有2C的App Store,而且主要收入是《堡垒之夜》,营收上不依赖Unreal引擎服务,这在商业模式上允许它向“操作系统”演变。但是unreal引擎应该比较难做到,我个人不太看好。
Apple方面,虽然现在还看不到Apple XR OS具体的表现,不过Apple是懂操作系统的,从ARKit的技术路线也能看出来。
待解决问题3:更多的颠覆性 现在手机的形态已经很够用了,用户大量的时间都陷在手机上。如果没有非常大的颠覆性,用户根本没有动力转移到XR上。即使Quest Pro都是不完备的,哪怕把Quest Pro的售价做到Quest 2的水平,重量和舒适度做到现在很多AR分体机的眼镜部分的水平,可能也只会比游戏主机市场大一点而已。元宇宙也只是比开放世界游戏更开放一点,米哈游完全可以在手机平台上就恰到这口饭。
“手机够用”这一点的压制力其实非常强。而XR在哪里还有这么大的颠覆力度?我比较抱希望给眼镜腿里塞两串脑机接口。
这个脑机接口根本不用做到科幻小说里那种意念、感受上传下载的水平。只需要非侵入式BCI,把模式识别做好,做到能当作一个高效输入、监听方案就够了。关键是刚好够用,就跟手机一样。
图源:网络
非侵入式BCI的传感器其实很便宜,包括肌电传感器在内成本都非常低,在摄像头面前就跟免费一样。贵的是数据采集出来之后怎么分析。如果不配上大数据和最新的机器学习技术,传统滤波器根本分析不出多少东西来。不过公正地说,过去的研究者是很厉害的,手撕滤波器也得到了一些发现。其中XR最容易利用的发现,我认为是ERD/ERS相关去同步化和同步化。
ERD/ERS模式能实现的是用大脑想象一个动作当做发号指令,下面简称想象动作。
在对于想象动作的识别当中,最简单的一类是识别是左手还是右手的动作。众所周知大脑呈天然的左右对称形态,在左右脑外侧都有传感器的情况下,可以很容易地区分出左右脑电位的变化,对应到XR设备就是在两个镜腿上。
单纯的眼动追踪像是一个没有按键的“鼠标”,可以Focus,但无法进行点击动作,需要搭配另外的Action。而BCI的ERD/ERS模式可以非常容易做到2个Action,为这个“鼠标”补上那两个按键。这样就能不动声色地做出大部分交互。
图源:网络
在2016年Hololens和Magic Leap那个年代,脑机接口是完全没办法产品化的。因为当时的机器学习技术和现在相比差太远了,连Transformer都得到2017年才出现。但是今天,其实可以试一试了。今天使用BERT甚至GPT去解脑电图我认为是有希望的,而且厂商其实不用全都自己做,可以和其他机构合作,就像手机上的GPS定位系统也是买来的。
BCI只是一个技术,技术要和商业模式配套。BCI的发展也会和GPS很像,会首先在专业市场做起来,然后搭载XR设备并带着XR设备做到大众市场。只要BCI技术达到一个临界点,就会有相应的商业模式跟进来。基于GPS的美团、滴滴们,一定会在基于BCI的领域出现,这样才能引爆新一代个人终端浪潮。
而手机做不到的原因正是它的使用形态所决定的,手机离头的距离比眼镜离头的距离远太多,这个优势是XR能做的必要条件,就像PC不能移动,但是手机能移动一样。
结语 只有将以上3个问题解决之后,XR才能进入10亿俱乐部。
第1个人机交互问题,可以看到Meta和Apple都有投入在解决。
第2个操作系统问题,Apple有投入,Meta的则投入少的可怜,可能是Meta没有做操作系统的基因,也或者可以解读成Facebook“社交网络+开放平台”的路径依赖让它把资源倾斜到Horizon里了,顺便还把卡马克气走了。
第3个BCI的问题,目前只有非常少的人关注到,只有Valve和少量创业公司有在尝试解决。
如果是我,应该会重点解决这3个问题。当然这只是我个人的判断,做出这种判断也和个人成长经历有关。其中也没有提到显示设备、电池、穿戴等的问题,这个大家应该比较容易感受到,产业链也都在解决。
欢迎大家通过回复参与讨论和指正批评,也愿大家在新的一年走得更踏实一些。
作者:Guoen_0
来源公众号:VR陀螺(ID:vrtuoluo),XR行业垂直媒体,关注VR/AR的头部产业服务平台。
本文由人人都是产品经理合作媒体 @VR陀螺 授权发布,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
给作者打赏,鼓励TA抓紧创作!
{{{path> 赞赏