XR日报：Meta自称是AR真正的信徒，Vision Pro开放摄像头API+意念操控

编辑：刘余欣 | 分类：快讯 | 2025年5月14日

加入映维网会员

本日报由AI生成，可能存在信息错误，具体可查看原文。

nxr-daily

◐ Meta CTO表示和扎克伯格都是“AR眼镜的真正信徒”

Meta CTO安德鲁·博斯沃思在a16z访谈中强调，其与扎克伯格对AR眼镜作为”后手机时代”核心设备具有不可动摇的信念，认为AR交互范式迭代是”三代人一遇”的技术跃迁，承诺Meta将不计成本推动技术突破（涉及AI、可穿戴硬件及沉浸式体验堆栈）。

◐ Google I/O 2025前瞻：AI眼镜原型亮相，Gemini多模态交互重塑无界面计算

谷歌在预热活动中暗示将在2025年I/O大会（5月20-21日）展示AI眼镜原型，该设备集成微型显示屏与Gemini多模态AI，具备：实时视觉交互：支持跨语言翻译（如西班牙语→波斯语）、物体识别（书籍/钥匙卡定位）、音乐控制等场景；无界面操作：通过自然语言直接触发指令（如”播放专辑曲目”），结合AR导航叠加；Android XR生态布局：同期举办两场闭门演讲，介绍Jetpack SceneCore工具链与Compose XR框架，推动开发者构建3D沉浸应用。

◐ 谷歌专利提出偏振分束器的像素移位，提升AR/VR显示感知分辨率

谷歌提出一种基于偏振分束器（PBS）的像素移位技术，通过时分复用将单个物理像素扩展为多个虚拟像素，显著提升AR/VR显示的感知分辨率。其核心技术突破包括：

双路径偏振调制：利用PBS将非偏振光分解为S/P偏振分量，通过半波片、双折射板等元件在两条光路中实现像素位移（水平/垂直/对角线方向）
动态虚拟像素生成：同步切换可调半波片状态，单像素可生成2-4个虚拟像素（如图7双向移位器实现四倍分辨率提升）
光路优化设计：反射式光路结构确保位移均匀性，避免重影伪影，兼容微型LED/OLED显示模组

◐ 三星发布5000 ppi OLEDoS：亮度15000尼特，8K VR显示质量

三星与eMagin在SID Display Week展会上推出1.4英寸硅基OLED面板，突破性技术指标包括：

超高分辨率：5000 PPI（是Meta Quest 3的4倍），彻底消除VR”纱窗效应”
极致显示性能：120Hz刷新率下实现15,000尼特亮度（演示版达20,000尼特），99%色域覆盖率
量产计划：预计2025年底投产，将应用于下一代高端VR头显

◐ 苹果Vision Pro辅助功能升级：开放摄像头API+意念操控

苹果为Apple Vision Pro推出革命性辅助功能升级，重点包括：智能视觉增强：主摄像头支持任意元素放大（虚拟/现实对象），结合机器学习实时环境描述（如识别食谱图文），为视障用户提供操作支持；开发者赋能：开放主摄像头API，允许辅助功能应用实现实时视觉辅助服务（如远程人工导览）；脑机接口整合：与Synchron合作推出BCI协议，未来用户可通过意念操控Vision Pro（已通过切换控制功能实现系统级支持）。

◐ 研究员提出ACMPTCP协议：AI动态优化多路径传输，助力8K VR无卡顿串流

美国爱荷华州立大学研发ACMPTCP协议，通过深度强化学习（DRL）动态优化多路径传输，解决AR/VR等高带宽应用的网络需求。该技术突破性体现在：智能路径管理：实时感知网络状态（延迟/丢包率），自动选择最优传输路径；自适应带宽分配：在6G网络环境下动态调整资源，支持4K/8K VR视频流（1-20Mbps码率）。

◐ 印度混合现实初创公司Flam获得1400万美元A轮融资

印度混合现实初创公司Flam完成1400万美元A轮融资，其核心技术为基于平面媒介扫描的MR体验（如报纸/广告牌触发3D内容），已服务谷歌、三星等100余家品牌。

◐ Synchron脑机接口将支持Vision Pro意念操控

脑机接口公司Synchron宣布将率先适配苹果BCI Human Interface Device协议，使其植入式脑机接口设备成为visionOS官方支持的输入外设。该技术允许用户直接通过意念操控Apple Vision Pro等苹果设备，并深度集成系统级辅助功能（如切换控制）。此前Synchron已实现全球首例BCI操控Vision Pro的临床案例（2024年），并与英伟达合作演示智能家居控制（2025年）。此举标志着脑机接口正式成为苹果生态的原生交互方式。

◐ 研究员提出CNN-LSTM模型实现VR/AR自然手势交互

英国拉夫堡大学联合美国多所高校提出基于三维手骨架模型与深度学习融合的手势识别技术，通过CNN提取空间特征+LSTM建模时序动态，实现高精度自然交互。该技术突破性体现在：