北京时间周一晚,英伟达发布下一代人工智能超算芯片。

英伟达对其火爆的H100 人工智能GPU进行了重磅升级,最新款高端芯片名为H200,基于英伟达的“Hopper”架构,是该公司第一款使用HBM3e高带宽内存的GPU,这种内存速度更快、容量更大,因此更适合处理大型数据集,而这是开发大型语言模型所必需的。

英伟达公司表示,基于HBM3e,H200以每秒4.8 TB的速度提供141GB的内存,与A100相比,容量几乎是其两倍、带宽增加了2.4倍。

在备受瞩目的人工智能领域,英伟达提到,H200将带来进一步的性能飞跃。在Llama 2(700亿参数的LLM)上的推理速度比H100快了一倍。未来的软件更新预计会给H200带来额外的性能领先优势和改进。

H200将在具有四路和八路配置的英伟达HGX H200服务器主板中提供,并与HGX H100系统的硬件和软件兼容。

大型计算机制造商和云服务提供商预计将于明年第二季度开始使用H200。亚马逊的AWS、Alphabet公司的谷歌云、微软Azure和甲骨文的云基础设施,都承诺从明年开始使用这款新芯片。

英伟达负责超大规模和高性能计算的副总裁Ian Buck表示,“要通过生成式AI和高性能计算HPC应用程序来创建智能,必须使用大型、快速的GPU,高速有效地处理大量数据。借助H200,业界领先的端到端AI超级计算平台能够更快地解决世界上一些最重要的挑战。”

英伟达表示,通过新产品,公司正试图跟上用于创建人工智能模型和服务的数据集的规模。添加增强的内存能力将使H200在用数据轰炸软件时速度更快,也即训练AI执行图像识别和语音等任务的过程。媒体援引英伟达数据中心产品的负责人的话说,“当你观察市场上正在发生的事情时,你会发现模型正在迅速扩大。这是我们继续迅速推出最新、最先进技术的又一个例子。”

英伟达早盘一度追随美股大盘小幅下跌,盘中急速拉涨,上涨约1.4%,收涨0.6%,连续第九个交易日上涨。

伴随着人工智能的火爆,英伟达的高端GPU需求量极大。这也令其他芯片制造商瞄准这一利润丰厚的市场,加快推出高品质的AI芯片,整个AI芯片市场竞争相当激烈。英伟达此举旨在巩固其在AI计算市场的主导地位。

AMD将于本季度推出MI300芯片,AMD透露,已有多家超大规模云服务商承诺将部署MI300芯片产品。华尔街见闻网站此前提及,业内人士透露,拥有更大显存的MI300,在部署32K上下文窗口的GPT-4模型时效果更好。具体来说,与H100相比,MI300的性能优势在20%-25%,具体取决于上下文长度和提示长度/每次查询输出的token数量。

此外,英特尔公司声称其AI芯片Gaudi 2比H100更快。

近日市场还关注的热点是,英伟达已开发出针对中国市场的最新改良版系列芯片——HGXH20、L20PCle和L2PCle。据澎湃新闻,有知情人士称,最新三款芯片是由H100改良而来。英伟达最快或将于本月16号之后公布,国内厂商最快将在这几天拿到产品。多位产业链人士均证实英伟达改良版芯片属实。

对此,环球时报评论文章称,有人说,美国政府和英伟达展开了一场限制与反限制的“猫鼠游戏”。从表面上看好像是这样,但这个比喻模糊了问题的本质,也混淆了是非。英伟达和美国政府的这几个回合,是一个正当做生意的高科技企业,遭遇来自政治对自由贸易的强力干扰、束缚和破坏,为了自己的生存与发展想尽办法的故事。对商业公司来说,这一点也不搞笑,甚至有些悲哀。美国对华的芯片出口管制措施是没道理的,它不仅对中国利益有害,也对美国利益有害,已经有越来越多的人看到这一点,并希望华盛顿作出调整。

英伟达将于下周公布财报。今年其AI GPU广受欢迎,推动了该公司业绩的井喷。市场预计英伟达本财报季的收入将激增170%。

风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。