Google I/O 2025前瞻：AI眼镜原型亮相，Gemini多模态交互重塑无界面计算

编辑：刘余欣 | 分类：快讯 | 2025年5月14日

谷歌暗示下周将演示备受期待的AI智能眼镜

（映维网Nweon 2025年05月14日）2025年的I/O大会将于5月20日至21日举行‌，而在日前举行的中，谷歌暗示下周将演示搭载微型显示屏和Gemini人工智能助手的AI眼镜原型。

具体来说，在直播活动的最后，谷歌Android生态系统总裁萨米尔·萨玛特（Sameer Samat）表示谷歌I/O 2025将于下周二举行，而届时将有来自开发者的深度介绍，谷歌Gemini的最新进展……这时他停顿了一下并戴上一款眼镜设备，然后补充道“甚至是非常酷炫的Android演示”。说完后萨玛特转身离开，直播结束。

Google I/O 2025前瞻：AI眼镜原型亮相，Gemini多模态交互重塑无界面计算

谷歌早前在温哥华举行的TED2025: Humanity Reimagined活动中展示了一款搭载微型显示屏和Gemini人工智能助手的AI眼镜原型，以及与三星合作的MR头显“无限”。

◐ 延伸阅读：Ted放出谷歌AI眼镜和MR头显演讲视频：下一个计算平台？你的眼镜

其中，谷歌介绍的重点是搭载微型显示屏和Gemini人工智能助手的AI眼镜原型。

这款AI眼镜可以提供简单的图形叠加，并主要与智能手机配对，所以可以非常轻便，并访问一系列的手机应用。另外，谷歌演示了一系列的用例：

基础多模态：演示者要求Gemini根据所看到的画面写一首俳句，而她同时看着台下的观众，这时Gemini回答说：“Faces all aglow. Eager minds await the words. Sparks of thought ignite/容光映眸明，渴心静待智言声，星火迸思程”。
滚动上下文记忆：演示者把目光从一个包含一本书的书架移开，然后询问Gemini道“我身后书架的那本白色的书”的标题是什么，Gemini回答正确。然后她尝试了一个更难的问题，询问“酒店钥匙卡”在哪里，但没有给出任何其他线索。然而，Gemini依然能够根据过往视图画面正确地回答出来。
复杂多模态：拿着一本书，演示者询问里面的图表是什么意思，同样回答正确。
转译：看着一个西班牙语的标志，没有说明是什么语言，然后Gemini能够成功把译成英语。然后，演示者邀请台下观众选择，有人提出波斯语，而Gemini同样功地将标志转译成波斯语。
多语言支持：演示者可以用印地语与Gemini交谈，而且无需提前改变任何语言“模式”或“设置”，它可以立即以印地语响应。
执行用户要求的操作：演示者看着手中的一张实体专辑，并告诉Gemini播放其中的一首曲目。这个助手马上在手机播放歌曲，并通过蓝牙传输到眼镜。
导航：Gemini可以直接在视场提供指示和小地图。

另外，根据早前公布的演讲安排，本届I/O大会有两场与Android XR相关的演讲，但不会提供网络直播：

用3D内容为Android XR开发差异化应用

主讲人：开发者关系工程师德雷克·布里迪（Dereck Bridié）；开发者关系工程师帕特里克·富恩特斯（Patrick Fuentes）

简介：加入我们，我们将介绍Jetpack SceneCore和ARCore for Jetpack XRJetpack XR，并指导开发人员将沉浸式内容（如3D模型，立体视频和手部追踪）添加到现有应用程序中。参与者将了解Android XR SDK开发者预览版中的新功能，并为今年晚些时候公开发布的Android XR获得必要的知识。”