雨果·巴拉:行业北极星Vision Pro过度设计不适合产品市场

Meta推出全新一代AI芯片MTIA v2

查看引用/信息源请点击:映维网Nweon

这枚芯片的架构从根本上专注于为排名和推荐模型提供计算、内存带宽和内存容量的正确平衡。

(映维网资讯)Meta最初在2023年5月推出了采用台积电7nm工艺的第一代自研AI训练和推理芯片MTIA v1。

日前,这家公司发布了全新一代的MTIA v2,采用台积电5nm工艺,每PE缓存从上一代的128KB增加到384KB,频率从800MHz提升到1.35GHz,INT8精度下的稠密算力达到上一代的近3.5倍,稀疏算力达到上一代的近7倍,达到708TFLOPS。不过,MTIA v2的面积变大了13%,而功耗则增加到上一代的3.6倍,达到90W(上一代只有25W)。

在一篇博文中,Meta表示公司下一代的大规模基础设施正在围绕人工智能进行建设,包括支持全新的生成式人工智能产品、推荐系统和先进的人工智能研究。随着支持人工智能模型的计算需求随着模型的复杂性而增加,他们预计这项投资将在未来几年增长。

在2023年,Meta推出了AI训练和推理加速器(MTIA)v1,这是公司的第一代人工智能推理加速器。团队在设计时考虑到了Meta的人工智能工作负载。它是专门为深度学习推荐模型而设计,并旨在改善Meta旗下应用和技术的各种体验。

这家公司表示:“MTIA是为Meta独特的工作负载提供最高效架构的长期赌注。随着人工智能工作负载对我们的产品和服务越来越重要,这种效率将成为我们为世界各地的用户提供最佳体验的核心。MTIA v1是提高我们基础设施计算效率和更好地支持我们的软件开发者构建人工智能模型的重要一步。”

全新一代的MTIA使得解决方案的计算和内存带宽增加了一倍多,同时保持了与工作负载的紧密结合。它旨在有效地服务于为用户提供高质量推荐的排名和推荐模型。

这枚芯片的架构从根本上专注于为排名和推荐模型提供计算、内存带宽和内存容量的正确平衡。

MTIA已部署在Meta的数据中心,而目前正在为生产中的模型提供服务。Meta表示,已经看到了这个项目的积极成果,因为它使得团队能够为更密集的人工智能工作负载投入更多的计算能力。

到目前为止的结果表明,这枚MTIA芯片可以处理低复杂度和高复杂度的排名和推荐模型,而这是Meta产品的关键组成。因为可以控制整个堆栈,所以与商用GPU相比,可以实现更高的效率。

Meta对定制芯片的持续投资

MTIA将成为Meta为独特人工智能工作负载构建和扩展最强大、最高效的基础设施的长期路线图的重要组成。

Meta表示:“我们正在设计我们的定制芯片,以结合我们现有的基础设施以及我们未来可能利用的更新的、更先进的硬件。实现我们对定制芯片的雄心意味着不仅投资于计算芯片,同时包括投资于内存带宽、网络和容量,以及其他下一代硬件系统。”

这家公司指出,目前有多个旨在扩大MTIA范围的项目正在进行中,包括对GenAI工作负载的支持。他们总结道:“这段旅程才刚刚开始。”

本文链接https://news.nweon.com/119869
转载须知:转载摘编需注明来源映维网并保留本文链接
素材版权:除额外说明,文章所用图片、视频均来自文章关联个人、企业实体等提供
QQ交流群苹果Vision  |  Meta Quest  |  微软HoloLens  |  AR/VR开发者  |  映维粉丝读者
资讯