谷动谷力

 找回密码
 立即注册
查看: 525|回复: 0
打印 上一主题 下一主题
收起左侧

英特尔挑战Nvidia发布全新Gaudi 3 AI芯片 AMD积极扩大处理器阵容

[复制链接]
跳转到指定楼层
楼主
发表于 2024-4-12 16:24:04 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式



英特尔挑战Nvidia发布全新Gaudi 3 AI芯片 AMD积极扩大处理器阵容



英特尔今天宣布推出了一款新的AI芯片——Gaudi 3,并承诺该芯片的性能是英特尔上一代芯片的4倍。

英特尔挑战Nvidia发布全新Gaudi 3 AI芯片 AMD积极扩大处理器阵容


英特尔在Intel Vision 2024大会上详细介绍了该产品,并分享了有关英特尔AI战略的最新信息。英特尔计划与合作伙伴展开合作,对于融合了多厂商组件的AI硬件系统将加大供货量。在此事件的背景下,竞争对手AMD也正在通过推出面向互联设备市场的新片上系统增强了自己的AI处理器阵容。

英特尔Gaudi 3

英特尔在2019年通过20亿美金收购初创公司之后获得的处理器系列如今已经更新到第三代——Gaudi 3。与前身相比,这款新的芯片承诺在处理BF16格式(这种格式被AI应用广泛使用)的数据时性能可提高4倍,同时还具有更高的网络带宽,这意味着部署在同一个AI集群中的Gaudi 3芯片可以更快地与另一个芯片交换数据。

该芯片使用两组板载核心进行计算。第一种核心类型——TPC经过优化,可以加速深度学习模型在处理数据时通常执行的几种类型的计算,这些计算包括批量归一化,一种通过将深度学习模型接收到的原始输入数据转换为更好的格式来加速深度学习模型操作。

Gaudi 3中还包括了所谓的MME核心。这些核心同样旨在加速AI模型用于处理数据的计算,但与TPC核心不同的是,它侧重于不同的计算集。MME电路可以加速运行卷积层的任务,卷积层是图像识别模型中常见的软件构建块。

Gaudi 3具有64个TPC核心和8个MME核心,分布在两个模片(或半导体模块)上。这些模块相互连接,可以作为单一的芯片使用,此外还提供了128 GB板载HBM2e内存支持,这种高速RAM可让AI模型快速访问计算所需的数据。

英特尔上一代Gaudi芯片采用的是台积电7纳米工艺制造。到了Gaudi 3,英特尔已经改用更新的5纳米节点,从而能够生产出更快速、更节能的晶体管。
英特尔表示,一台服务器可以安装8个Gaudi 3芯片,每个芯片都包含21个以太网链路,用于与邻近的Gaudi 3单元交换数据。每个处理器上还有另外3个网络链路(总共24个),用于与主机服务器外部的芯片进行交互。

英特尔表示,Gaudi 3的性能不仅优于上一代芯片,还优于Nvidia的H100。在内部评估中,英特尔确定Gaudi 3可以将主流Llama 2大语言模型某些版本的训练速度提高50%,还承诺推理速度比H200快30%。H200是Nvidia H100芯片的增强版,专门针对大型语言模型进行了优化。

英特尔高级副总裁、数据中心和AI事业部总经理Justin Hotard表示:“企业会权衡可用性、可扩展性、性能、成本和能源效率等因素。英特尔 Gaudi 3作为生成式AI的替代方案脱颖而出,是一个结合了具有令人信服的性价比、系统可扩展性和价值实现时间优势的组合。”

在这次发布Gaudi 3的Intel Vision活动上,英特尔还透露了有关英特尔AI战略的最新信息。英特尔表示,正在与包括Red Hat和SAP在内的十多家合作伙伴合作,创建一个“企业AI开放平台”,该计划的目标是让企业能够使用整合了多家厂商硬件和软件的AI优化型系统。

据英特尔称,这些系统经过优化可以运行具有RAG功能的AI模型。RAG(检索增强生成)是一种机器学习技术,可以让大型语言模型吸收新的信息并将其纳入回答中,而无需进行高成本的再训练过程。

作为该计划的一部分,英特尔将发布参考实现,展示如何使用带有Gaudi和Xeon芯片的服务器来运行AI工作负载,还将为Tiber Developer Cloud增加更多基础设施容量。Tiber Developer Cloud是一个云平台,在该平台上英特尔客户可以使用英特尔处理器来训练和运行AI模型。

AMD的新AI芯片

在英特尔Intel Vision活动的背景下,竞争对手AMD也宣布推出了两个新的芯片产品线,主要设计用于为智能汽车子系统等边缘计算设备提供动力,并且这两个芯片系列都加入了英特尔现有的Versal产品组合,这是英特尔2022年以500亿美金收购Xilinx获得的。

Versal产品组合中的所有处理器都包含两种类型的电路。有些电路是为特定任务而构建的,例如运行AI模型或者处理传感数据。每个Versal芯片还包括适应性强的计算模块,客户可以根据自己的特定要求进行调整。这些模块基于FPGA技术,而这项技术最初就是由Xilinx开发的。

AMD这次推出的两个Versal芯片系列中,第一个是AI Edge Series Gen 2,该系列中的每个处理器都包含三组计算模块,有基于Arm设计的CPU核心,AI优化的电路以及可定制的FPGA模块。FPGA电路可以将来自连接设备中的传感器数据转换为更易于设备板载AI模型处理的格式。

Subaru公司是Versal AI Edge Series Gen 2的早期客户之一,该公司计划在多款汽车中安装这个系列的芯片,并利用这些处理器为自己的EyeSight先进驾驶辅助系统提供动力。该系统提供了自适应巡航控制和自动制动等安全功能。

AMD今天详细介绍了AI Edge Series Gen 2,以及另一个名为Prime Series Gen 2的新芯片系列,其设计与之前的产品系列类似,但不包括AI优化的计算模块。Prime Series Gen 2系列中的每款芯片均采用基于Arm的CPU核心、针对处理视频流进行优化的模块以及可定制的FPGA电路。

+10
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|深圳市光明谷科技有限公司|光明谷商城|Sunshine Silicon Corpporation ( 粤ICP备14060730号|Sitemap

GMT+8, 2024-11-24 17:37 , Processed in 0.259071 second(s), 42 queries .

Powered by Discuz! X3.2 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表