映维日报:阿里亮相AI眼镜,网红用Ray-Ban Meta偷拍女性遭曝光
本日报由AI生成,可能存在信息错误,具体可查看原文。
鞍钢数智科技(辽宁)有限公司发布VR语音实验室建设项目招标公告,预算32万元,要求投标方注册资金不低于100万元。该项目不接受联合体投标,需通过鞍钢智慧招投标平台获取采购文件(每套100元),并于2025年8月5日13时前提交电子响应文件。采购文件明确要求提供营业执照、授权委托书等资质文件,并强调失信被执行人投标无效。项目由企业自筹资金,采用谈判采购方式,联系人及招标公司信息已公布。
南充市身心医院发布32万元预算的5G+VR探视系统采购询价公告,要求供应商于2025年8月1日9时30分前通过四川省政府采购一体化平台提交响应文件。该项目不接受联合体投标,采购文件免费在线获取,开标将通过电子化系统进行。公告明确了供应商资格要求、质疑投诉渠道及联系方式,并规定最高限价为231.49万元,合同需在180日内履行完成。
浙江交通职业技术学院发布84.7万元预算的VR空乘教学实训室采购招标,要求投标方于2025年8月18日14时前通过政采云平台提交投标文件。该项目接受联合体投标,供应商需符合政府采购法规且无失信记录,招标文件免费获取。开标将采取线上线下结合方式在杭州进行,需落实支持中小企业等政府采购政策,同时公布了完整的质疑投诉渠道和联系方式。
◐ 英伟达发布VideoPanda模型 支持文本或单视图生成360度视频
英伟达研究团队开发出名为VideoPanda的新型生成模型,能够通过文本提示或单视图视频数据合成高质量360度全景视频。该技术基于改进的视频扩散模型架构,新增多视图关注层实现多视角一致性生成,并通过自回归方式支持长视频制作。研究显示,与现有方法相比,VideoPanda在真实感和连贯性方面表现更优,同时解决了全景视频制作设备昂贵、流程复杂的问题。论文显示该模型已支持8×16视帧矩阵生成,并可通过迭代扩展视频时长,但画质随时间推移衰减的问题仍需优化。
◐ Rokid智能眼镜销量突破30万台 计划下半年新增打车功能
Rokid创始人祝铭明透露,其智能眼镜产品Rokid Glasses自2024年11月发布以来已售出30万台,目前重点转向产能提升。该产品采用高通骁龙AR1平台,重量仅49克,支持全天续航及近视定制,集成多款AI大模型实现智能交互功能。团队宣布将与高德地图、支付宝合作,于下半年推出实时打车信息显示功能。
江苏杨集镇派出所利用PICO VR头显为暑托班学生举办沉浸式普法活动,通过模拟校园欺凌等场景让学生身临其境体验突发事件,并结合实际案例讲解法律知识。活动中学生可观察虚拟场景中的互动并学习正确应对方法,民警同步解析相关法律条款,有效提升了青少年防范网络诈骗和依法维权的意识。
◐ PICO用户分享:用NVIDIA Canvas AI绘画制作VR全景图
NVIDIA推出的免费AI绘画工具NVIDIA Canvas支持生成360度全景图,用户通过简单绘制即可由AI实时转换为逼真景观,并导出至PICO VR等头显设备观看。该工具基于生成对抗网络技术,提供多种自然元素和风格选项,支持全景模式创作4K等距柱状图像。教程详细介绍了硬件要求、安装步骤及创作流程,包括图层管理、3D预览等功能,适用于专业设计师和普通用户快速制作可沉浸式观看的全景内容。
一名女性用户Herculyse在社交媒体控诉网红Jose Reyes未经其同意,使用Ray-Ban Meta智能眼镜偷拍并上传其视频,引发公众对AI/AR眼镜隐私问题的担忧。Herculyse表示自己在超市被搭讪时不知情被拍摄,发现视频后感到羞辱和愤怒。尽管她要求Instagram删除视频未果,但通过社交媒体曝光后,网友集体声讨迫使该网红道歉并撤下视频。事件再次激化对智能眼镜可能侵犯隐私的争议。
◐ 腾讯发布混元3D世界模型1.0,支持文字图片生成可交互3D场景
腾讯在2025世界人工智能大会上正式发布并开源混元3D世界模型1.0,该模型支持通过文字或图片输入快速生成可漫游、交互及仿真的3D虚拟场景,无需专业建模经验,生成内容可适配Vision Pro等头显设备。其核心技术包括语意层次化3D场景生成算法,能将场景解构为不同层级并输出标准化3D资产,兼容主流开发工具。腾讯同时宣布了端侧混合推理语言模型、多模态模型等开源计划,并强调混元系列模型在代码、数学推理及多模态理解等领域表现领先。
◐ 丹麦技术大学开发Weak Cube R-CNN 仅需2D标注实现3D物体检测
丹麦技术大学研究团队提出Weak Cube R-CNN模型,通过利用预训练2D基础模型提供的深度和方向信息作为伪真值,仅需2D边界框标注即可训练3D物体检测系统。该方法创新性地设计了包含法向量损失、姿态对齐损失等多重约束的弱监督损失函数,在SUN RGB-D数据集上达到与标注时间相当的3D监督方法相比提升5.3%的检测精度。研究显示该技术特别适用于室内场景中几何结构简单的物体检测,有效降低了传统3D标注所需的高额时间成本。
◐ 牛津大学与苏黎世联邦理工联合开发DNF-Avatar 实现67FPS实时角色重照明
牛津大学与苏黎世联邦理工学院研究团队提出DNF-Avatar技术,通过将隐式神经场知识蒸馏到显式2D高斯飞溅表示,结合创新的局部环境遮挡探针,实现了从单目视频创建可动画虚拟角色的实时重照明。该技术采用分割求和近似替代传统蒙特卡洛光追,在保持与教师模型相当质量的同时,将渲染速度提升370倍至67帧/秒。研究显示,该方法能有效处理新姿势下的阴影计算,解决了神经辐射场渲染速度慢的行业难题。
◐ 相信AI眼镜是下一代个人移动入口,阿里亮相哇哦Quark Glasses
阿里巴巴在2025世界人工智能大会上推出首款自研AI眼镜”哇哦Quark Glasses”,产品分为带屏和无屏双版本,采用骁龙AR1+恒玄2800双芯片方案,配备可换电设计及Micro-LED光波导显示技术。该眼镜集成通义千问大模型,支持支付宝支付、高德导航等阿里生态功能,并具备AI影像增强能力。阿里巴巴智能终端业务总裁宋刚表示,AI眼镜将成为继智能手机后的下一代个人移动入口,但目前尚未公布具体售价和上市时间,预计可能在双十一期间发售。
◐ 单项最高奖励15万美元,Meta就表面肌电图腕带和控制算法征集研究提案
Meta Reality Labs面向全球高校教师公开征集肌电图(sEMG)人机交互研究提案,重点探索运动学习策略和神经运动伦理两大方向。该项目提供最高15万美元/项的资助,计划支持6个研究项目(至少4个在美国),要求提案包含新型教学方法开发、伦理风险评估等内容,并需在2025年9月1日前提交。研究需基于商用肌电技术,重点关注非拟态控制、游戏化学习等创新交互方式,成果需包含用户研究及开放发表计划。申请者须为具备博士授予资格院校的教职人员。
◐ PICO用户分享:轻松解决PICO存储问题,一键释放空间
PICO社区用户”VV碳”开发了一款名为PicoObbCleaner的清理工具,可自动识别并删除VR头显中因应用更新残留的旧版数据文件。该Python程序通过ADB连接启用开发者模式的PICO设备,扫描Obb目录后保留最新版本文件,清理冗余缓存。教程显示使用后最多可释放20GB存储空间,解决了256G版PICO 4系列因游戏体积增大导致的存储不足问题,同时避免了重置设备导致的数据丢失风险。工具包包含通用ADB驱动,操作过程需保持USB调试模式。
◐ VR游戏《Eldramoor: Haven in the Mist》成功众筹123万元
Resolute Games开发的VR MMORPG《Eldramoor: Haven in the Mist》在Kickstarter平台完成众筹,1.5小时内达成目标,最终获得1011名支持者共计17.15万美元(约123万元人民币)的资金。这款游戏提供五大生物群落的冒险体验,包含采矿、制作、PVP等玩法,强调VR沉浸感和包容性设计,计划于2026年末登陆Meta Quest和SteamVR平台。
◐ 2025年07月26日美国专利局新申请AR/VR专利摘选
美国专利局最新公布的41项AR/VR专利揭示了行业技术趋势:Meta聚焦人机交互优化,提出基于眼动追踪的动态渲染技术(专利1)和低功耗处理器调控方案(专利2);苹果重点布局光学与交互设计,包括柔性波导防损结构(专利6)和基于形状的3D界面反馈系统(专利5);谷歌研发纳米压印工艺降低AR镜片反射(专利13),并探索异步重投影技术(专利14)。其他亮点包括三星的多层半导体显示技术(专利18)、索尼的眼动追踪透镜(专利22)、Snap的介质加载天线眼镜(专利28),以及微软的MEMS热稳定镜模块(专利32)。高通和HTC分别贡献了点云编码(专利38)和3D模型流式传输优化方案(专利40)。这些专利覆盖显示、交互、硬件设计等核心领域,预示下一代头显将向更轻薄、低功耗、高沉浸感方向发展。