微软推出最新 Azure 虚拟机 ND H200 v5 系列

🕗 发布于 2024-10-12 07:22 microsoft azure

声明：本文翻译自微软全球官方博客，ND H200 v5 系列虚拟机目前只在 Microsoft Azure 海外版上发布。

随着人工智能领域的高速发展，企业对于可扩展和高性能基础设施的需求呈指数级增长。客户需要 Azure AI 基础设施来开发智能驱动的创新解决方案，为满足客户的需求，我们推出了基于 Azure ND H200 v5 系列虚拟机（VM）的新型云端人工智能超级计算集群。这些虚拟机现已在 Microsoft Azure 海外版上正式发布，专为处理复杂的高级人工智能工作负载（从基础模型训练到生成推理）量身定制。ND H200 v5 虚拟机的规模、效率和增强性能，推动了客户对于微软人工智能服务（如 Azure 机器学习和 Azure OpenAI 服务（国际版））的采用。

H200 超级计算集群的设计还能更高效地管理 GPU 内存的模型权重、键值缓存和批处理大小，这些因素都会直接影响基于大语言模型（LLM）的生成式人工智能推理工作负载中的吞吐量、延迟和成本效益。ND H200 v5 VM 拥有更大的高带宽内存容量，可以支持更高的批处理大小。与 ND H100 v5 系列相比，ND H200 v5 VM 可在推理工作负载中实现更高的 GPU 利用率和吞吐量。在早期测试中，我们观察到在运行 LLAMA 3.1 405B 模型的推理工作负载中，ND H200 v5 虚拟机的吞吐量比 ND H100 v5 系列提升高达 35%。

Azure ND H200 v5 虚拟机采用微软的系统设计方法，以提高效率和性能。特别要说明的是，它还解决了 GPU 原始计算能力增长速度远快于附带内存和内存带宽的差距问题。相比上一代 Azure ND H100 v5 虚拟机，Azure ND H200 v5 系列虚拟机的高带宽内存（HBM）增加了 76%，141 GB 的高速内存和 4.8 TB/秒的内存带宽，可以处理更大的数据集和更复杂的模型。高带宽内存的增加，使 GPU 能够更快地访问模型参数，从而有助于降低整体应用延迟，这对于交互式代理等实时应用，至关重要。

ND H200 v5 系列以单个虚拟机和 8 个 NVIDIA H200 Tensor Core GPU 开头，与 900 GB/s NVLink 互连。基于 ND H200 v5 的部署可以纵向扩展到成千上万个 GPU，每个虚拟机的互连带宽为 3.2Tb/秒。VM 内的每个 GPU 都具备其自己专用的、与拓扑无关的 400 Gb/秒 NVIDIA Quantum-2 CX7 InfiniBand 连接。这些连接在占用同一虚拟机规模集的 VM 之间自动配置，并且支持 GPUDirect RDMA。

ND H200 v5 虚拟机已预先集成 Azure 批处理、Azure Kubernetes 服务、Azure OpenAI 服务（国际版）和 Azure 机器学习，可帮助企业快速上手。

您可以扫描下方二维码，了解有关全新 Azure ND H200 v5 虚拟机的更多参数信息。

原文地址：https://blog.csdn.net/helendemeng/article/details/142852736

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【无人机设计与控制】基于控制避障函数(CBF)的四旋翼安全控制
下一篇：Qt初识_项目文件解析

行情波动，普通人有必要开融资融券账户吗？
同时，投资者也应该在充分了解融资融券交易的特点和风险后做出决策。融资融券账户因此成为了一种杠杆交易方式，能够增加投资者的投资收益，但同时也伴随着相应的风险。最后，需要强调的是，无论是否开通融资融券交易
阅读更多2024-10-14
智能码二维码zhinengma.cn的防伪技术有哪些创新点？
智能码二维码的防伪技术不仅提高了产品的防伪溯源能力，还为企业带来了精准营销和用户互动的机会。
阅读更多2024-10-14
多级缓存架构设计
应用 Nginx 本地内存Redis 缓存JVM 内存DB接入层 Nginx：处理入口流量，用作流量分发应用层 Nginx：接近业务层，处理业务逻辑，用作热点缓存的读取Nginx 作为高性能的 Web
阅读更多2024-10-14
UM981的机械尺寸和工作条件
注：因产品会不断更新升级，最新的参数指标请参考和芯星通官方网站。图1 UM981机械尺寸。图2 UM981 机械图。图3 UM981工作条件。
阅读更多2024-10-14
【前端】Bootstrap：响应式布局与工具类
Bootstrap 作为一个强大的前端框架，不仅为开发者提供了丰富的组件，还内置了强大的响应式设计工具。这些工具使得网页能够适应不同设备的屏幕尺寸，无论是桌面、平板，还是手机，网页都能呈现最佳的用户体
阅读更多2024-10-14
Unity DOTS框架学习系列四
本文主要介绍Unity的多线程式数据导向型技术堆栈(DOTS)，将具体阐述DOTS的核心机制与概述。Unity DOTS（Data-Oriented Technical Stack）是一个面向数据的技
阅读更多2024-10-14
搭建车载仿真环境进行测试时的主要步骤和注意事项
车载仿真环境进行测试
阅读更多2024-10-14
Python知识点：基于Python工具，如何使用Brownie进行智能合约测试
Brownie是一个基于Python的智能合约开发和测试框架，它提供了一套完整的工具来帮助开发者编写、测试和部署智能合约。Brownie是一个功能强大的Python框架，它简化了智能合约的开发和测试过
阅读更多2024-10-14
【零基础学懂算法】：动态规划算法
文章首先帮助读者理解动态规划中的关键概念，如“状态”和“状态转移方程”，并深入分析如何从这些概念出发解决复杂问题。接着，文章提供了清晰的做题步骤，包括如何进行状态的填表、初始化、计算以及如何从中提取最
阅读更多2024-10-14
机器学习——解释性AI
解释性AI（XAI）是一种人工智能技术，旨在提高ML模型和AI系统决策的解释和可解释性。XAI通过揭示AI系统背后的推理、决策和预测过程，以及解释其结果和行为，使人们能够理解、相信和信任AI系统的行为
阅读更多2024-10-14

微软推出最新 Azure 虚拟机 ND H200 v5 系列

相关文章