微软 Azure AI 基础设施是微软扩展产品和服务的核心支柱,为开发人员提供在 Azure 平台上构建下一代 AI 驱动的应用程序所需的系统、工具和资源。
微软在硬件和 AI 基础设施上的早期投资,正在帮助客户将 AI 的高效和创新变现为业务价值。借力 AI,用户可以创造更丰富的用户体验,推动创新,提高业务生产力。
微软 Azure AI 基础设施能够支持全球可扩展,且未来微软仍将对其进行持续投资与扩展。现在,微软推出了 ND H100 v5 虚拟机系列,这款虚拟机配备了 NVIDIA H100 Tensor Core 图形处理单元(GPU)和低延迟网络,推动企业步入 AI 应用新时代。
前所未有的 AI 处理和规模
ND H100 v5 虚拟机系列发布
微软全新发布Azure ND H100 v5 虚拟机(VM)系列,现已在美国东部和美国中南部 Azure 区域提供。该系列配备了最新的 NVIDIA H100 Tensor Core GPU 和 NVIDIA Quantum-2 InfiniBand 网络。凭借在超级计算性能和规模方面的丰富经验,微软精心设计的 ND H100 v5 系列虚拟机,用于应对先进的 AI 工作负载带来的日益增加的复杂性。作为微软在 AI 领域深入和持续投资的一部分,微软正在利用一个 AI 优化的 4K GPU 集群,并将在明年将其扩展到数十万个全新的 GPU。
ND H100 v5 VM 虚拟机系列具有以下特性:
-
AI 超级计算 GPU:配备了八个 NVIDIA H100 Tensor Core GPU。比起上一代虚拟机,该系列可让 AI 模型显著提速,为企业提供无与伦比的计算能力。
-
新一代计算机处理单元(CPU):CPU 性能对于 AI 的训练和推理至关重要,微软选择了第四代 Intel Xeon Scalable 处理器,确保虚拟机达到最佳的处理速度。
-
低延迟网络:采用 NVIDIA Quantum-2 ConnectX-7 InfiniBand,每个 GPU 拥有 400Gb/s、每个 VM 拥有 3.2 Tb/s 的跨节点带宽,确保 GPU 间的无缝性能,堪称全球顶级的超级计算机。
-
优化主机到 GPU 的性能:通过PCIe Gen5提供每个GPU 64GB/s的带宽,Azure在CPU和GPU之间具有显著的性能优势。
-
大规模的内存和内存带宽:DDR5 内存是该系列虚拟机的核心,提供更高的数据传输速度和效率,使它们成为处理大规模数据集工作负载的理想选择。
该系列虚拟机已经证明了它们的性能优势,使用新的8位 FP8 浮点数据类型进行矩阵乘法操作时,速度提升了六倍,比前一代的 FP16 更快。ND H100 v5 VM 帮助大型语言模型(如 BLOOM 175B 端到端模型)实现了最高两倍的推理速度提升,验证了它们进一步优化 AI 应用的潜力。
由 Azure AI 基础设施支持的人工智能,具有推动从制造到零售、从金融服务到医疗保健等各行各业发展的潜力。
-
微软
+关注
关注
4文章
6591浏览量
104044
原文标题:Azure AI 基础设施强势升级!进一步扩展人工智能能力
文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论