Google I/O 2025前瞻:AI眼镜原型亮相,Gemini多模态交互重塑无界面计算
谷歌暗示下周将演示备受期待的AI智能眼镜
(映维网Nweon 2025年05月14日)2025年的I/O大会将于5月20日至21日举行,而在日前举行的中,谷歌暗示下周将演示搭载微型显示屏和Gemini人工智能助手的AI眼镜原型。
具体来说,在直播活动的最后,谷歌Android生态系统总裁萨米尔·萨玛特(Sameer Samat)表示谷歌I/O 2025将于下周二举行,而届时将有来自开发者的深度介绍,谷歌Gemini的最新进展……这时他停顿了一下并戴上一款眼镜设备,然后补充道“甚至是非常酷炫的Android演示”。说完后萨玛特转身离开,直播结束。
谷歌早前在温哥华举行的TED2025: Humanity Reimagined活动中展示了一款搭载微型显示屏和Gemini人工智能助手的AI眼镜原型,以及与三星合作的MR头显“无限”。
其中,谷歌介绍的重点是搭载微型显示屏和Gemini人工智能助手的AI眼镜原型。
这款AI眼镜可以提供简单的图形叠加,并主要与智能手机配对,所以可以非常轻便,并访问一系列的手机应用。另外,谷歌演示了一系列的用例:
-
基础多模态:演示者要求Gemini根据所看到的画面写一首俳句,而她同时看着台下的观众,这时Gemini回答说:“Faces all aglow. Eager minds await the words. Sparks of thought ignite/容光映眸明,渴心静待智言声,星火迸思程”。
-
滚动上下文记忆:演示者把目光从一个包含一本书的书架移开,然后询问Gemini道“我身后书架的那本白色的书”的标题是什么,Gemini回答正确。然后她尝试了一个更难的问题,询问“酒店钥匙卡”在哪里,但没有给出任何其他线索。然而,Gemini依然能够根据过往视图画面正确地回答出来。
-
复杂多模态:拿着一本书,演示者询问里面的图表是什么意思,同样回答正确。
-
转译:看着一个西班牙语的标志,没有说明是什么语言,然后Gemini能够成功把译成英语。然后,演示者邀请台下观众选择,有人提出波斯语,而Gemini同样功地将标志转译成波斯语。
-
多语言支持:演示者可以用印地语与Gemini交谈,而且无需提前改变任何语言“模式”或“设置”,它可以立即以印地语响应。
-
执行用户要求的操作:演示者看着手中的一张实体专辑,并告诉Gemini播放其中的一首曲目。这个助手马上在手机播放歌曲,并通过蓝牙传输到眼镜。
-
导航:Gemini可以直接在视场提供指示和小地图。
另外,根据早前公布的演讲安排,本届I/O大会有两场与Android XR相关的演讲,但不会提供网络直播:
用3D内容为Android XR开发差异化应用
主讲人:开发者关系工程师德雷克·布里迪(Dereck Bridié);开发者关系工程师帕特里克·富恩特斯(Patrick Fuentes)
简介:加入我们,我们将介绍Jetpack SceneCore和ARCore for Jetpack XRJetpack XR,并指导开发人员将沉浸式内容(如3D模型,立体视频和手部追踪)添加到现有应用程序中。参与者将了解Android XR SDK开发者预览版中的新功能,并为今年晚些时候公开发布的Android XR获得必要的知识。”
未来已至,Compose与AI加持Android XR
主讲人:高级产品经理塞西莉亚·阿巴迪(Cecilia Abadie);开发者关系工程师简·克莱纳特(Jan Kleinert)
简介:用Android XR探索沉浸式体验的未来。本议程将介绍Android XR SDK测试版的最新内容,包括对Jetpack Compose XR和尖端AI功能的增强。了解如何利用你在大屏幕开发方面的现有投资,并轻松地将你的触角扩展到令人兴奋的Android XR世界。