雨果·巴拉:行业北极星Vision Pro过度设计不适合产品市场

XR日报:Steam平台PICO份额月增1.01%,PICO创新工具赋能机器人、AI等开发者

◐ Steam 4月数据:PICO 4份额加1.01%,系当月增幅最大头显

Valve日前公布了2025年4月份的Steam硬件和软件调查数据。其中,VR头显用户占比略减0.01%至1.74%。在头显方面,Meta Quest 2大幅减少1%,跌破30%至29.84%。另外,PICO 4则增加1.01%,系当月增幅最大的头显。

◐ PICO分享:用SecureMR构建具备隐私保护的AI场景理解MR应用

PICO推出的SecureMR框架通过安全隔离的隐私计算方案,解决了XR设备在AI场景理解中面临的隐私保护难题。该技术将机器学习模型部署在头显的安全进程中运行,允许应用通过张量传递数据但禁止读取原始图像,确保摄像头数据不外泄。开发者可利用预置算子(如模型推理、3D渲染、坐标转换等)构建流水线,实现人脸检测、物体识别等功能,并通过开源示例(如UFO人脸追踪、YOLO物体检测)快速验证。配套工具链支持模型格式转换与Python模拟调试,为开发隐私安全的MR应用提供完整解决方案。

◐ 西北大学提出基于物理的文本到3D高斯飞溅运动生成框架

美国西北大学团队提出了一种创新的文本到3D生成框架,通过结合大型语言模型(LLM)的提示优化和基于物理的运动模拟技术,实现了高保真3D对象的生成和真实物理运动的合成。该框架利用扩散先验引导的高斯飞溅(3DGS)技术生成具有精确几何结构和外观的3D模型,并通过连续介质力学变形图和颜色正则化技术模拟物理基础运动,确保动量和质量守恒。实验证明该方法能生成高质量、物理真实的3D运动,为虚拟现实和增强现实应用提供了新的创作工具。尽管目前存在材质类型有限和光照交互不足的限制,但该框架在集成自然语言处理、生成建模和物理模拟方面展现了显著潜力。

◐ 索尼专利分享智能眼镜基于言语头部运动分析的精神分裂症评估系统

索尼公司提出了一项基于智能眼镜的精神分裂症评估系统专利,通过分析用户说话时的头部运动特征来评估精神分裂症症状。研究表明,精神分裂症患者言语相关的头部运动幅度(平均1.48毫米/帧)显著低于健康人群(2.50毫米/帧)。该系统利用头戴设备的声学传感器和运动传感器,分别捕获语音数据及同步头部运动数据,通过算法提取语音节奏特征并匹配对应的头部运动模式,最终与数据库中的基线指标对比生成症状严重程度评级(如运动幅度下降41%对应特定症状等级)。该系统支持长期动态监测,可通过用户界面反馈病情变化,为精神分裂症的日常筛查和病情追踪提供了非侵入性解决方案。

◐ 谷歌专利分享基于双自适应透镜动态调节的XR虚拟内容景深控制系统

谷歌在专利申请中提出了一种通过动态调节透镜组改变XR设备虚拟内容显示深度的技术方案。该头戴式显示设备(如AR眼镜)包含眼侧透镜和世界侧透镜两组自适应透镜,通过施加电压可分别调整为凹透镜(负屈光度)和凸透镜(正屈光度)。当两组透镜同时激活时(如眼侧-0.5D/世界侧+0.5D),虚拟内容以较近距离(第一虚拟深度)显示;停用时则恢复较远距离(第二虚拟深度)。系统支持手动切换或通过环境传感器自动调节,结合波导显示技术和菲涅耳棱镜膜实现虚实场景的精准对焦,解决了传统XR设备虚拟内容固定景深导致的视觉疲劳问题。

◐ 中科大与Hidream团队提出文本驱动的零样本立体视频生成系统T-SVG

中国科学技术大学与Hidream团队联合提出了一种基于文本驱动的立体视频生成系统 T-SVG,该系统通过跨模型、零样本(zero-shot)技术简化了立体视频制作流程。传统立体视频制作依赖复杂设备或3D建模,而T-SVG创新性地结合文本到视频生成、深度估计与视频绘制技术,首先生成参考视频,再将其转换为3D点云序列并渲染为双目视差视频,实现自然立体效果。实验表明,T-SVG在保真度、运动一致性等指标上表现优异,其模块化设计无需重新训练即可适配未来先进模型,显著降低了立体内容创作门槛,为XR领域提供了高效、易用的解决方案。

◐ 北大、字节团队提出全向图像到视频生成的运动控制方法OmniDrag

北京大学和字节跳动团队提出了一种名为 OmniDrag 的创新方法,用于实现沉浸式全向视频(ODV)的精确运动控制生成。传统文本到ODV方法存在内容不准确的问题,而现有2D视频控制技术直接应用于ODV时会导致空间失真。OmniDrag 通过引入 全向控制模块 和 球形运动估计器(SME),支持用户通过简单拖拽操作控制场景级和对象级运动。此外,团队还发布了 Move360 数据集,包含高质量ODV运动数据以提升模型性能。实验表明,OmniDrag 在生成可控性、运动准确性和质量上优于现有方法,但仍面临基础模型生成限制和运动解耦等未来挑战。

◐ PICO在HarvardXR展示创新开发者工具:赋能机器人、AI、3DGS和Web开发者

在HarvardXR 2025大会上,PICO作为赞助方展示了四项突破性开发者工具:

  • XR Robotics Toolkit:通过XR设备远程操控机器人并采集训练数据,支持具身智能研究;

  • PICO Splat:开源UE5插件,实现PICO 4 Ultra对3D/4D高斯点云的沉浸式渲染;

  • SecureMR:隐私优先的端侧AI框架,本地处理摄像头数据完成物体识别、姿态估计等任务;

  • WebSpatial:跨平台开源框架,允许Web开发者使用React/CSS快速构建XR空间化应用。

◐ Passthrough Camera API实验:MR+足球训练

Meta正式开放Passthrough Camera API后,开发者利用该技术实现了物理足球与数字目标的交互实验。通过对象识别与追踪技术,系统能将动态数字目标投射到真实墙面,用户踢中目标后触发数字特效(如目标碎裂),适用于足球精准度训练或趣味游戏。演示视频显示Meta Quest 3的摄像头系统能高质量桥接物理与数字世界,但当前API仅支持Quest 3/3S机型,存在40-60毫秒延迟,对快速移动物体的精细追踪仍具挑战性。

◐ 研究员分享基于混合2D-3D高斯溅射的几何精确高保真头部Avatar重建

中国科学院联合多所高校及英特尔团队提出 MixedGaussianAvatar 方法,通过混合2D-3D高斯溅射技术实现高保真3D Avatar重建。传统神经辐射场(NeRF)方法存在训练慢、渲染效率低的问题,而纯3D高斯(3DGS)虽提升效率却因多视图不一致导致几何精度不足,2D高斯(2DGS)虽几何精确但渲染质量受限。该团队创新性地将2D高斯附着于FLAME模型网格以保证表面几何精度,并在渲染薄弱区域绑定3D高斯进行色彩补偿,形成混合表示。结合渐进式训练策略(先训练2D高斯后微调混合模型)和FLAME参数驱动,该方法在几何准确性与渲染逼真度上均超越现有技术,为虚拟现实等领域提供了高效、高质量的Avatar生成方案。

◐ 《Gorilla Tag》提供带rogue-like元素的全新合作PvE模式

VR游戏《Gorilla Tag》推出全新合作PvE模式“Ghost Reactor”,融合rogue-like元素与团队协作玩法。玩家将扮演大猩猩公司矿工,在每次20分钟的轮班中与小队成员共同探索随机生成的矿山地图,对抗幽灵并收集光谱核心。模式强调战术分工(如排雷、除灵、复活队友)与紧急逃生(警报触发后需撤离),失败后需从起点重新开始。该模式支持单人挑战或最多4人联机,现已正式上线。

◐ 解谜冒险游戏《Ghost Town》在Quest提供30分钟的免费试玩

随着Meta Quest商店免费模式(F2P)的兴起,付费游戏面临转型压力。Fireproof Games的解谜冒险VR游戏《Ghost Town》原价29.99美元,现推出30分钟免费试玩版以吸引玩家。游戏设定在1983年超自然伦敦,玩家扮演幽灵猎人伊迪丝,通过逻辑解谜、咒语施法和灵魂召唤寻找失踪的哥哥。该作采取”免费试玩+完整付费”策略,区别于直接转为F2P或调整DLC模式的其他付费游戏。

◐ XR设备管理平台ArborXR收购数据分析团队InformXR

XR设备管理平台ArborXR宣布收购数据分析公司InformXR,并同步推出集成化分析套件ArborXR Insights,旨在解决企业VR培训中的数据盲区问题。该套件通过自动捕获学员表现数据并与现有学习系统对接,帮助企业量化XR培训的投资回报率(ROI)。目前产品已进入40家客户的封闭测试阶段,预计今夏全面上线。此次收购将InformXR的分析技术整合至ArborXR的设备管理平台,强化了从设备管控到培训效果评估的全链条服务能力。

本文链接https://news.nweon.com/129524
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者

您可能还喜欢...

资讯