英伟达推出首款CPU，或将在2023年正式投入使用 (英伟达首发价)

今日凌晨，一年一度影响人工智能及高性能计算技术盛会NVIDIAGTC如期而至，这是GTC大会继去年后第二次在线上举行，其图形和加速器设计师宣布他们将再次设计自己的Arm处理器/SoC。

整理分享英伟达推出首款CPU，或将在2023年正式投入使用 (英伟达首发价)，希望有所帮助，仅作参考，欢迎阅读内容。

内容相关其他词:英伟达发布,英伟达发布,英伟达新品,英伟达首发价,英伟达发布,英伟达新品,英伟达新品,英伟达新品,内容如对您有帮助，希望把内容链接给更多的朋友！

这款CPU以计算机编程先驱、美国海军少将格*&#;霍珀(GraceHopper)的名字命名，它是英伟达在全面垂直整合硬件堆栈方面的最新尝试，能够在常规GPU产品的同时提供高性能CPU。据英伟达介绍，该芯片是专为大规模神经网络工作负载设计的，预计将于年在英伟达的产品中使用。距离芯片准备完毕仍有两年，英伟达这次表现得相对克制。该公司只提供了关于芯片有限的细节——例如，未来它将基于Arm的Neoverse内核的迭代——因为今天的发布会更多关注的是英伟达未来的工作路线图，而不是速度和产品。目前，英伟达已经明确表示，“Grace”是英伟达的内部产品，将作为其大型服务器产品的一部分。该公司并没有直接争夺英特尔或AMDEPYC服务器市场。相反，他们正在建造自己的芯片来补充他们的GPU产品，创造一种可以直接连接其GPU的专用芯片，帮助处理庞大的万亿级参数人工智能模型。

从广义上说，“Grace”旨在填补英伟达AI服务器产品中CPU的空白。该公司的GPU非常适合某些特定类的深度学习工作负载，但不是所有工作负载都是纯粹的GPU-bound，所有工作负载都不都是GPU绑定的。相应地，英伟达当前的服务器产品通常依赖于AMD的EPYC处理器，该处理器对于以通用计算为目的而言非常快，但缺少英伟达寻找的那种高速I/O和深度学习优化。尤其是，NVIDIA目前因使用PCIExpress进行CPU-GPU连接而成为瓶颈。它们的GPU可以通过NVLink进行快速通信，但不能返回主机CPU或*RAM。

正因如此，该问题解决方案是使用NVLink进行CPU-GPU通信，就像“Grace”之前的情况一样。此前，英伟达曾与OpenPOWER基金会合作，将NVLink引入到POWER9中。然而，随着POWER的流行度下降，以及POWER正在跳过NVLink，这种关系似乎正在逐渐消失。相反，NVIDIA正在以自己的方式构建带有必要NVLink功能的Arm服务器CPU。根据英伟达的说法，最终的结果将是一种高性能、高带宽的CPU，其设计目的是与未来一代的英伟达服务器GPU协同工作。在英伟达讨论将每个英伟达GPU与一个GraceCPU集成在同一块板上的情况下（类似于今天的夹层卡），CPU性能和*内存不仅随GPU的数量而增加，而且通过迂回方式。这是一个英伟达特色鲜明的解决方案，不仅可以提高性能，而且在传统上集成了AMD或Intel的处理器尝试某种类似的CPU+GPU融合发挥。据估计到年，英伟达将达到NVLink4,SoC和GPU之间的累积带宽将至少达到GB/秒，GraceSoC之间的累积带宽将超过GB/秒。关键在于，这大于SoC的内存带宽，这意味着NVIDIA的GPU将有一个到CPU的高速缓存连贯链接，可以在全带宽下访问*内存，同时也允许整个*拥有一个单一的共享内存*空间。英伟达将此描述为平衡*中可用的带宽数量。拥有包内CPU是增加NVIDIAGPU能够有效访问和使用的内存数量的主要手段，因为内存容量仍然是大型神经网络的主要*因素——你只能有效地运行与本地内存池一样大的网络。这种以内存为中心的策略也反映在Grace的内存池设计中。由于英伟达将CPU放在GPU共享包上，并将把RAM放在其旁边。Grace配备的GPU模块将包括一个有待确定的LPDDR5x内存数量，英伟达的目标是至少达到GB/秒的内存带宽。在年，LPDDR5x或将成为带宽最高的非显卡存储器选项。此外，由于LPDDR5x技术的目的是应用于移动设备，而且*长度非常短，英伟达还在大力宣传使用LPDDR5x可以提高能源效率。同时，由于这是服务器部分，Grace的内存也将启用ECC。

至于CPU性能，这实际上是英伟达公布最少的部分。该公司将使用下一代Arm的NeoverseCPU内核，最初的N1设计已经成为了转折点。但是除此之外，该公司透露内核应该在SPECrate_int_base吞吐量的基准上突破点，这可以与AMD第二代核EPYCCPU中的某些处理器相媲美。该公司没有透露太多关于如何配置CPU或专门针对神经网络处理添加了哪些优化。但是，由于Grace旨在支持NVIDIA的GPU，预计在GPU较弱的情况下它会更强大。另外如前所述，NVIDIA对Grace的预期目标是大大减少大型神经网络模型所需的时间。NVIDIA力争在1万亿个参数模型上实现倍的更高性能，而他们对模块Grace+A*（具有理论NVLink4支持）的性能预测将把此模型的训练时间从一个月缩短至三天。或者，能够在8个模块的*上对亿个参数模型进行实时推断。NVIDIA的ProjectDenver计划最初于十年前宣布，但从未真正达到NVIDIA预期。自定义Arm内核家族仍不够好，也从未使用NVIDIA的移动SoC制成。相比之下，对于NVIDIA而言，Grace是一个更安全的项目。它们只是授予Arm内核许可，而不是构建自己的内核，这些内核也将被其他许多方使用。因此，英伟达的风险得以降低，可以在很大程度上使I/O和内存检测正确无误，并保持最终设计的能源效率。

如果一切都按计划进行，有望在年见到Grace。NVIDIA已经确认Grace模块将可用于HGX载板，以及扩展为DGX和所有其他使用这些板的*。因此，尽管我们还没有看到英伟达有关Grace计划的全部内容，但是显然，他们正在计划使其成为未来服务器产品的核心部分。有网友调侃到，这是要抢高通的生意吗？对此你怎么看呢？欢迎在评论区留下你的想法哦！.ptg{padding-left:px;background:*('./static/image/common/tag.gif')no-repeatpx;line-height:px;}.ptga{color:#;}cpu,芯片,处理器该文章被收录于：编程器

英伟达推出首款CPU，或将在2023年正式投入使用 (英伟达首发价)

一例声控闪光灯电路的工作原理分析 (声控闪光灯原理图和pcb设计)

大金多联机线控器在工程中的设置与应用 (大金多联机线控器611说明书)

九阳JYC-21CS3电磁炉多次爆机 (九阳JYC-21CS3电磁炉)

微波炉不能加热的故障检修 (微波炉不能加热的故障检修)

全核4.8GHz轻轻松松！i9-10980XE评测：这才是值得发烧友拥有的顶级处理器 (全核4.8和5.0区别大吗)

Win10怎么新建多个桌面？Win10新建多个桌面的方法 (win10如何创建多个桌面)

小白装机系统是正版的吗 (小白安装电脑系统怎么样)

Win11任务栏太宽了如何维修？教你一招快速修改任务栏大小 (win11任务栏太宽怎么设置)

Win7电脑网速不稳定如何维修？电脑网络不稳定怎么修理 (吃辣第二天长痘痘)

win11任务栏图标靠左要怎么设置？ (win11任务栏图标没了)