雨果·巴拉:行业北极星Vision Pro过度设计不适合产品市场

XR日报:Meta自称是AR真正的信徒,Vision Pro开放摄像头API+意念操控

本日报由AI生成,可能存在信息错误,具体可查看原文。

◐ Meta CTO表示和扎克伯格都是“AR眼镜的真正信徒”

Meta CTO安德鲁·博斯沃思在a16z访谈中强调,其与扎克伯格对AR眼镜作为”后手机时代”核心设备具有不可动摇的信念,认为AR交互范式迭代是”三代人一遇”的技术跃迁,承诺Meta将不计成本推动技术突破(涉及AI、可穿戴硬件及沉浸式体验堆栈)。

◐ Google I/O 2025前瞻:AI眼镜原型亮相,Gemini多模态交互重塑无界面计算

谷歌在预热活动中暗示将在2025年I/O大会(5月20-21日)展示AI眼镜原型,该设备集成微型显示屏与Gemini多模态AI,具备:实时视觉交互:支持跨语言翻译(如西班牙语→波斯语)、物体识别(书籍/钥匙卡定位)、音乐控制等场景;无界面操作:通过自然语言直接触发指令(如”播放专辑曲目”),结合AR导航叠加;Android XR生态布局:同期举办两场闭门演讲,介绍Jetpack SceneCore工具链与Compose XR框架,推动开发者构建3D沉浸应用。

◐ 谷歌专利提出偏振分束器的像素移位,提升AR/VR显示感知分辨率

谷歌提出一种基于偏振分束器(PBS)的像素移位技术,通过时分复用将单个物理像素扩展为多个虚拟像素,显著提升AR/VR显示的感知分辨率。其核心技术突破包括:

  • 双路径偏振调制:利用PBS将非偏振光分解为S/P偏振分量,通过半波片、双折射板等元件在两条光路中实现像素位移(水平/垂直/对角线方向)

  • 动态虚拟像素生成:同步切换可调半波片状态,单像素可生成2-4个虚拟像素(如图7双向移位器实现四倍分辨率提升)

  • 光路优化设计:反射式光路结构确保位移均匀性,避免重影伪影,兼容微型LED/OLED显示模组

◐ 三星发布5000 ppi OLEDoS:亮度15000尼特,8K VR显示质量

三星与eMagin在SID Display Week展会上推出1.4英寸硅基OLED面板,突破性技术指标包括:

  • 超高分辨率:5000 PPI(是Meta Quest 3的4倍),彻底消除VR”纱窗效应”

  • 极致显示性能:120Hz刷新率下实现15,000尼特亮度(演示版达20,000尼特),99%色域覆盖率

  • 量产计划:预计2025年底投产,将应用于下一代高端VR头显

◐ 苹果Vision Pro辅助功能升级:开放摄像头API+意念操控

苹果为Apple Vision Pro推出革命性辅助功能升级,重点包括:智能视觉增强:主摄像头支持任意元素放大(虚拟/现实对象),结合机器学习实时环境描述(如识别食谱图文),为视障用户提供操作支持;开发者赋能:开放主摄像头API,允许辅助功能应用实现实时视觉辅助服务(如远程人工导览);脑机接口整合:与Synchron合作推出BCI协议,未来用户可通过意念操控Vision Pro(已通过切换控制功能实现系统级支持)。

◐ 研究员提出ACMPTCP协议:AI动态优化多路径传输,助力8K VR无卡顿串流

美国爱荷华州立大学研发ACMPTCP协议,通过深度强化学习(DRL)动态优化多路径传输,解决AR/VR等高带宽应用的网络需求。该技术突破性体现在:智能路径管理:实时感知网络状态(延迟/丢包率),自动选择最优传输路径;自适应带宽分配:在6G网络环境下动态调整资源,支持4K/8K VR视频流(1-20Mbps码率)。

◐ 印度混合现实初创公司Flam获得1400万美元A轮融资

印度混合现实初创公司Flam完成1400万美元A轮融资,其核心技术为基于平面媒介扫描的MR体验(如报纸/广告牌触发3D内容),已服务谷歌、三星等100余家品牌。

◐ Synchron脑机接口将支持Vision Pro意念操控

脑机接口公司Synchron宣布将率先适配苹果BCI Human Interface Device协议,使其植入式脑机接口设备成为visionOS官方支持的输入外设。该技术允许用户直接通过意念操控Apple Vision Pro等苹果设备,并深度集成系统级辅助功能(如切换控制)。此前Synchron已实现全球首例BCI操控Vision Pro的临床案例(2024年),并与英伟达合作演示智能家居控制(2025年)。此举标志着脑机接口正式成为苹果生态的原生交互方式。

◐ 研究员提出CNN-LSTM模型实现VR/AR自然手势交互

英国拉夫堡大学联合美国多所高校提出基于三维手骨架模型与深度学习融合的手势识别技术,通过CNN提取空间特征+LSTM建模时序动态,实现高精度自然交互。该技术突破性体现在:

  • 三维骨架建模:简化手部关节空间分布,增强静态/动态手势识别鲁棒性

  • 多模态优化:结合Dropout正则化与交叉熵损失函数,降低过拟合风险,识别准确率提升显著

研究证实其可适配VR/AR场景,未来与眼动追踪、语音识别融合将推动无界面化人机交互发展。

◐ 商汤与浙大研发GeoTexDensifier框架:几何纹理双优化打造高保真3D高斯飞溅模型

商汤科技与浙江大学联合提出创新性3D高斯飞溅(3DGS)框架GeoTexDensifier,通过几何-纹理双感知策略显著提升三维场景重建质量。该技术突破性地结合:

  • 纹理感知致密化:依据区域纹理丰富度动态调整高斯飞溅密度(高纹理区密集/低纹理区稀疏)

  • 几何感知分割:利用深度-法向先验验证飞溅位置,过滤偏离实际表面的噪点

实验显示,在MipNeRF 360等数据集上,其SSIM/PSNR指标优于Pixel-GS、MiniSplatting等方法,并已成功部署至Meta Quest实现实时VR交互。该研究为虚拟现实、数字孪生等领域提供更高保真度的3D重建解决方案。

本文链接https://news.nweon.com/129732
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者

您可能还喜欢...

资讯