当前位置：龙泉人才网 - 科技 -

Meta连甩AI加速大招！首推AI推理芯片，AI超算专供大模型训练

科技
2023-05-20 10:31
智东西

智东西

编译 | 李水青

编辑 | 心缘

智东西5月19日消息，当地时间5月18日，Meta在官网发布公告，为了应对未来十年AI算力需求急剧增长，Meta正执行一项宏伟计划——专为AI建设下一代基础设施。

Meta公布了其为AI构建下一代基础设施的最新进展，包括首款用于运行AI模型的定制芯片、一个全新的AI优化数据中心设计、首款视频转码ASIC，以及集成16000块GPU、用于加速AI训练的AI超级计算机RSC等。

Meta官网关于AI基础设施细节的披露

Meta将AI视为公司的核心基础设施。自从2010年Meta的第一个数据中心破土动工至今，AI已成为每天使用Meta系列应用程序的30多亿人的引擎。从2015年的Big Sur硬件到PyTorch的开发，再到去年Meta的AI超算的初步部署，Meta当下正将这些基础设施进一步升级进化。

一、Meta首代AI推理加速器，7nm制程、102.4TOPS算力

MTIA（Meta Training and Inference Accelerator），是Meta第一个针对推理工作负载的内部定制加速器芯片系列。

AI工作负载在Meta的业务中中无处不在，这是广泛应用项目的基础，包括内容理解、信息流、生成式AI和广告排名等。随着AI模型的大小和复杂性的增加，底层硬件系统需要在保持效率的同时提供指数级增长的内存和计算。但Meta发现CPU难以满足其规模所需的效率水平需求，于是针对这一挑战设计了Meta自研训练和推理加速器MTIA ASIC系列。

自2020年起，Meta为其内部工作负载设计了第一代MTIA ASIC。该加速器采用台积电7nm工艺，运行频率为800MHz，在INT8精度下提供102.4TOPS算力，在FP16精度下提供51.2TFLOPS算力。它的热设计功率（TDP）为25W。

据介绍，MTIA提供了比CPU更高的计算能力和效率，通过同时部署MTIA芯片和GPU，其将为每个工作负载提供更好的性能、更低的延迟和更高的效率。

二、布局下一代数据中心，开发首款视频转码ASIC

Meta的下一代数据中心设计将支持其当前的产品，同时支持未来几代AI硬件的训练和推理。这个新的数据中心将是面向AI优化设计，支持液冷AI硬件和连接数千个AI芯片的高性能AI网络，用于数据中心规模的AI训练集群。

据官网解读，Meta下一代数据中心还将更快、更经济地构建，并将补充其他新硬件，例如Meta的第一个内部开发的ASIC解决方案MSVP，旨在为Meta不断增长的视频工作负载提供动力。

随着生成式AI等新技术内容产生，人们对视频基础设施的需求进一步加剧，这推动Meta推出了一款可扩展视频处理器MSVP。

MSVP是Meta为内部开发的第一个用于视频转码的ASIC。MSVP是可编程和可扩展的，并且可以配置为有效地支持点播所需的高质量转码，以及直播所需的低延迟和更快的处理时间。未来，MSVP还将帮助为Meta应用系列的每个成员带来新形式的视频内容——包括AI生成的内容以及VR（虚拟现实）和AR（增强现实）内容。