首页 资讯热闻 科技要闻 汽车热点 手机沸点

您的位置: 首页 > 科技要闻 >

英特尔Gaudi 3挑战H200 AI PC,同台竞技“百TOPS”算力

2024-04-10 15:14:11来源: 今日都市网
  “目前,以人工智能为中心的创新正在以前所未有的速度发展,每个公司都在加速成为人工智能公司,这需要半导体技术的支持。从PC到数据中心再到边缘,英特尔正在让人工智能进入各行各业。我们将再次改变世界!”

  4月9日,在美国亚利桑那举行的“Intel Vision 英特尔CEO基辛格在2024年面对AI带来的机会时说出了上述豪言壮语。

  在这次会议上,英特尔宣布推出全新一代AI加速芯片Gaudi 数据中心处理器Xeon6和下一代酷睿Ultra客户端处理器家族(代号Lunarara) Lake),在AI方面,集中展示了其强大的创新能力。

  AI 今年PC出货4000万台,进入100TOPS时代。

  英特尔首次提出AI 去年年底举行的PC概念主题是“AI Everywhere”在新闻发布会上,英特尔正式向AI发布会代码MeteorrPC处理器产品酷睿Ultra,Lake。

  英特尔认为,酷睿Ultra是40年来最大的结构转变,采用分离式模块架构,首次采用Intel。 4工艺技术,也是第一个集成NPU的英特尔CPU,整体AI计算能力34TOPS,可以支持终端运行200亿大型模型。

  根据基辛格的说法,英特尔酷睿Ultra处理器为生产力、安全性和内容创作提供了全新的能力,为企业恢复PC设备提供了巨大的动力。截至目前,AI PC发货超过500万台,预计2024年将发货4000万台,设计超过230台,覆盖轻薄PC和游戏手持设备。

  据基辛格介绍,英特尔将于2024年推出下一代英特尔酷睿Ultra客户端处理器家族(代号Lunara) Lake),将具备超过100 在神经网络处理单元中,TOPS平台计算能力(NPU)上带来超过46 TOPS的计算能力。AI性能是上一代产品的3倍。

  现在,AI是行业的目标 PC的计算能力要求一般在40TOPS左右,比如去年年底高通推出的45TOPS计算能力。 Snapdragon X 英特尔推出的新一代酷睿UltraElite平台,以及AMD锐龙8040移动处理器的39TOPS等,将首次实现AIPC平台整体计算能力突破100TOPS,显著提升AIPC PC的能力表现,也是AI。在PC中注入更多创新的可能性。

  另外,英特尔还发布了Ultra覆盖英特尔酷睿。、英特尔®酷睿™、英特尔凌动®处理器和英特尔锐炫™包括显卡系列产品在内的全新边缘芯片主要面向零售、工业制造和医疗等关键领域。本季度将推出英特尔边缘AI产品组合中的所有新产品,今年将得到英特尔边缘平台的支持。

  Gaudi 3性能不输H200 Q3上市

  去年,英特尔Gaudii 2加速器发布时就引起了广泛的关注,被认为是英特尔在AI领域对英伟达发起冲击的信号。

  这次发布的Gaudi 3采用5nm工艺,第五代张量处理核心64个,矩阵计算引擎8个,采用128GB 速率达 3.7TB / s 的 HBM2e 内存和 96MB 速率达 12.8TB / s的SRAM,还具有24个200 Gbps以太网 RDMA 以及最高的NIC 16 条 PCIe5.0总线。

  Gaudi 3可以支持常见的模式、大语言模型、文本/图片生成、翻译、问答等。AI 功能。

  就软件生态而言,英特尔Gaudi 3针对生成式AI 提供端到端的全栈AI 软体解决方案,包括嵌入式软件,软件套件,AI 软件、AI 应用。

  英特尔表示,与英伟达H100芯片相比,训练性能提高170%,推理能力提高50%,平均能效提高40%,运行人工智能模型的速度是H100的1.5倍。另外,英特尔说,Gaudi 3大致相当于英伟达最新的H200,在某些领域甚至表现更好。

  据悉,与上一代产品相比,Gaudi FP8性能提升2倍,BF16 性能提升4倍,网络带宽提升2倍,内存带宽提升1.5倍。Gaudi 3产品线包括加速卡HL-325L,PCIe CEM和服务器主板HLB-325。

  Gaudi英特尔 3提供基于社区的开放软件和行业标准的以太网网络,允许企业灵活从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模推理、微调和培训。根据计划,英特尔将在2024年第一季度率先推出Gaudi 3风冷样品,第二季度推出液冷样品,今年第三季度通过。 OEM 该系统大量上市。

  Xeon6全新性能能效双路攻击

  英特尔至强处理器为目前运行的生成式AI解决方案提供了性能高效的解决方案,包括使用专有数据生成特定业务结果的RAG。与此同时,英特尔还更新了面向数据中心、云和边缘的下一代处理器的品牌,即英特尔至强6。

  在这次会议上,英特尔宣布为他们的数据中心 CPU 全新品牌命名推出产品组合:原代号为: Granite Rapids 和 Sierra Forest 现在的芯片将被称为 "Xeon 6" 系列。这些芯片计划在今年上市,并将支持标准化,提高新的性能。 MXFP4 数据格式。

  去年,英特尔公布了2023-2025年至强(Xeon)在处理器路线图中,显示未来最强系列处理器将分为P-Core和E-Core两个系列产品线,前者是传统的最强系列,后者是新增的能效结构,将提供更好的电源效率。Xeon6是第一款采用Inte3工艺的产品。

  据悉,英特尔至强6处理器配备了性能核(此前代号为Granitee) Rapids):包含对MXFP4数据格式的软件支持,可以将下一个令牌与使用FP16的第四代至强处理器相比。(token)Llama-2模型的延迟时间最长可缩短6.5倍,可运行700亿参数。

  英特尔至强6处理器配备了能效核(以前的代号是Sierrar Forest),与第二代相比,机架密度提高了2.7倍,机架数量从200个减少到72个;顾客可以达到近3个:1比例更换旧系统,大大降低功耗,每年可节约100万瓦能耗。

  英特尔表示,配备能效核心(E-cores)2024年第二季度将推出英特尔至强6处理器,提供卓越的效率,配备性能核。(P-cores)随后将推出英特尔至强6处理器,带来更高的AI性能。

  会上,通过超以太网联盟。(UEC),面对AI高速互联技术,英特尔正在推动AI高速互联技术(AI Fabrics)开放式以太网网络创新,推出了一系列以太网解决方案,用于AI优化。这些创新旨在大规模创新和纵向(scale-up)和横向(scale-out)为了支持AI模型的训练和推理,扩展的AI高速互联技术越来越大,每一代都会增加一个数量级。英特尔的产品组合包括英特尔AI网络连接卡(AI NIC)、AI连接芯片集成到XPU,基于Gaudi加速器的系统,以及一系列针对英特尔的AI互联软硬件参考设计。

  另外,英特尔联合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz联合宣布,将创建一个开放的平台,帮助企业推动AI创新。该计划旨在通过RAG(检索和增强生成)技术开发开放的多供应商生成AI系统,为部署提供一流的便利性、性能和价值。RAG可以开放大语言模型,让企业在标准云基础设施上运行的大量现有专有数据源。(LLM)增强功能。

版权与免责声明

1、服务快讯网对已注明来源的文章或图片等稿件进行转载是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。

2、本网转载作品均注明来源,如涉及作品内容、版权等问题,请及时与本网联系,我们将在第一时间删除内容。

3、其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。

4、联系我们:338 5255 390@qq.com