随着对复杂 AI 功能的需求不断增加,VAST Data 推出了 VAST 数据平台(Data Platform),该平台现已通过 NVIDIA BlueField DPU 进行增强。这项创新专为满足 AI 驱动数据中心的严格要求而量身打造,并优化了 AI 工作负载和数据管理。
本文介绍了 NVIDIA BlueField DPU 如何为 VAST 带来显著的性能和效率提升,确保更快的数据访问和处理速度,同时降低功耗和空间需求。
管理 AI 工作负载面临的挑战
优化 AI 工作负载需要管理大量非结构化数据,并确保高速数据访问以及保持强大的数据安全性。传统的数据存储和处理系统经常面临延迟、效率低下和可扩展性问题,这些问题可能会影响 AI 应用程序的性能。此外,实时数据处理和严格安全性的需求也增加了有效管理 AI 工作负载的复杂性。
NVIDIA BlueField DPU 的优势
NVIDIA BlueField-3 DPU 使组织能够满足现代 AI 工作负载的苛刻要求,确保更快的数据访问速度、强大的安全性和更高的整体效率。继续阅读如下内容,详细了解 NVIDIA BlueField DPU 为 VAST 数据平台和 AI 工作负载带来的具体优势。
提高存储效率、数据完整性和安全性
将 NVIDIA BlueField DPU 集成到 Vast 数据平台代表着存储处理技术的重大飞跃。通过将基本存储操作卸载到 DPU,可以降低功耗和空间,同时提高存储网络带宽、提高性能并确保可扩展性。这些增强功能对于处理 AI 应用程序中常见的大量数据至关重要,有助于提高数据访问速度和处理速度。
VAST Data 的最新产品代表了 AI 环境数据平台的关键发展,将高密度存储与前沿的 NVIDIA BlueField DPU 技术相结合。这种强大的组合可确保出色的性能、最大限度地提高效率,并为最具挑战性的 AI 环境提供所需的可扩展性。
在 VAST Data 的传统架构中,CNode(计算节点)是负责运行存储协议和管理服务的 x86 服务器。VAST 的独特方法是将 NVIDIA BlueField DPU 集成到其平台中。这种集成将基本存储操作从 CPU 卸载到 DPU,从而提高存储网络带宽并降低功耗。卸载到 DPU 可以减少所需的专用 CNode 数量,因为 DPU 可以更高效地处理必要的计算任务。
同样,通过减少计算节点,还可以减少对外部网络交换机的依赖,从而降低所需交换机的端口数量以及管理这些端口的复杂性和成本,从而简化网络架构。NVIDIA BlueField DPU 通过卸载和隔离存储功能、辅助并行数据服务以及在 AI 环境中提供块存储服务,显著增强了 I/O 操作的处理能力,从而实现更精简、更高效的基础设施,并减少了实现相同性能水平所需的物理服务器数量。
NVIDIA BlueField DPU 通过多种方式增强 VAST 数据平台,包括:
提高 I/O 性能:BlueField 可助力 NVMe 存储访问,以超过 60 GB/s 的速度处理数据,从而优化数据密集型应用程序的访问速度。
更好的存储性能:BlueField DPU 支持高达 400 Gbps,可以提高吞吐量和 I/O 效率。GPUDirect Storage 和 RDMA over Converged Ethernet (ROCE)等功能可以实现高效、低延迟的数据传输,对于高速数据密集型应用程序至关重要。
服务质量:每台 GPU 服务器均配备专用的 BlueField-3 DPU,为 VAST 并行服务操作系统提供支持。这使每个 DPU 都能够读取和写入 VAST 数据平台的共享命名空间,而无需跨容器协调 I/O,从而消除争用。
安全加速:BlueField DPU 可卸载加密和深度数据包检测等关键安全任务,减少 CPU 上的计算负载,并提高整体系统性能。BlueField-3 还无需使用内核驱动来处理 IO,这种方法可减少攻击面,并最大限度地减少主机漏洞的潜在影响,尤其是在多租户环境中。
提高效率:BlueField DPU 显著增强了存储处理能力,降低了功耗和空间需求,同时提高了存储网络带宽。
成果
将 NVIDIA BlueField DPU 集成到 VAST 数据平台后,取得了令人瞩目的成果:
性能增强:BlueField-3 从主 CPU 卸载计算密集型任务以提高性能,这对于 AI 应用程序是至关重要的。
服务质量:通过在容器内操作共享命名空间,每个 GPU 服务器都有一个专用的 BlueField DPU,可实现与数据节点的直接通信,从而减少延迟和跳数,从而简化 I/O 操作。
提高效率:该平台通过降低 77% 的功耗和 73% 的机架空间需求,为数据中心提供更具可持续性的解决方案。
强大的安全性:增强的安全功能可确保数据完整性并防止未经授权的访问。
这些进步使得 VAST 数据平台成为提高 AI 驱动数据中心的性能和效率的关键组件。该平台能够以更低延迟和更高安全性处理大量数据的能力尤为显著,为 AI 创新提供了坚实的基础。
通过集成 BlueField,VAST 可加速运营、简化安全管理并增强监控功能。BlueField 提供改进的数据服务和强大的安全功能,包括用于实时洞察和快速异常检测的高级遥测功能。这种集成不仅优化了性能,而且还减少了对大量硬件的需求,从而提高了系统效率和经济效益。BlueField DPU 是推动 VAST 数据平台(专为现代 AI 数据中心定制)先进性能和效率的关键组件。
VAST Data 与 NVIDIA 之间的合作对于推进 AI 基础设施发展至关重要,并彻底改变了 AI 驱动数据基础设施的格局。通过利用 NVIDIA BlueField-3 DPU,VAST Data 成功增强了其 AI 云架构,提供了前所未有的性能、安全性和效率。这种集成使 VAST Data 能够将关键的网络、存储和安全任务从 CPU 卸载到 DPU,显著减少数据中心的占用空间和功耗。
总结
NVIDIA 和 VAST Data 合作,为现代企业和服务提供商量身打造强大、可扩展且安全的 AI 基础设施。此集成解决方案可提高 AI 工作负载的性能,并简化广泛 AI 系统的部署和管理。
此外,NVIDIA BlueField-3 DPU 使 VAST Data 能够采用零信任安全模型,从而确保数据隔离和针对威胁的强大防护。在多租户环境中,安全高效的数据管理至关重要,这是一项基本功能。DPU 还支持直接在 AI 服务器中集成存储和安全处理服务,并实现服务质量(QoS)功能,以协调 DNode(数据节点)之间的 I/O,从而实现真正的线性可扩展性并消除数据服务争用。
随着 AI 不断推动创新和重塑行业,VAST Data 和 NVIDIA 之间的合作体现了将先进的 DPU 技术融入数据中心架构的优势。