2月11日,浪潮信息正式推出元脑R1推理服务器,通过系统创新和软硬协同优化,单机即可部署运行DeepSeek R1 671B模型,帮助客户降低DeepSeek R1全参数模型的部署难度及成本,并提升推理服务性能,加速千行百业探索智能涌现。
浪潮元脑R1推理服务器NF5688G7是高算效AI计算平台,原生搭载FP8计算引擎,针对DeepSeek R1 671B模型部署速度快且无精度损失。在显存方面,提供1128GB HBM3e高速显存,满足671B模型 FP8精度下不低于800GB显存容量的需求,单机支持全量模型推理情况下,仍保留充足的KV缓存空间。显存带宽高达4.8TB/s,契合DeepSeek R1模型"短输入长输出、显存带宽敏感"的技术特征,在推理解码阶段可实现加速。在通信方面,GPU P2P带宽达900GB/s,保障单机部署张量并行通讯性能,基于新推理框架单机可支持20-30用户并发。同时,单台NF5688G7服务器配备3200Gbps无损扩展网络,可根据用户业务需求增长实现敏捷扩展,提供成熟的R1服务器集群Turnkey解决方案。
浪潮元脑R1推理服务器NF5868G8服务器是专为大推理模型(Large Reasoning Model)创新设计的高吞吐推理服务器,业界实现单机支持16张标准PCIe双宽卡,提供高达1536GB显存容量,支持在FP16/BF16精度下单机部署DeepSeek 671B模型。创新研发基于PCIe Fabric的16卡全互连拓扑,任意两卡P2P通信带宽可达128GB/s,降低通信延迟超60%。通过软硬协同优化,相较传统2机8卡PCIe机型,NF5868G8服务器可将DeepSeek 671B模型推理性能提升近40%,目前已支持多元AI加速卡选配。

浪潮NF5466 G8服务器是4U双路存储优化服务器,兼顾高存储容量、强大计算性能和智能运维、节能,非常适用于温冷数据存储、视频存储、大数据存储、云存储池搭建、CDN缓存、数据迁移备份等应用场景。

浪潮NF5280 G8服务器是主流2U双路机架式服务器系列,支持英特尔®至强®6处理器(SP及AP均可支持)或第五代AMD EPYC™9005系列处理器。该系列产品在计算性能、存储性能、可扩展性方面均实现良好设计,支持前IO、液冷等多元部署方式,融合CXL 2.0等诸多技术落地,为业务细分场景提供差异化优能效比算力支撑,以百变形态实现通用场景全覆盖。

浪潮NF5180 G8服务器是1U2S高密计算型服务器系列,1U空间可搭载2颗TDP的英特尔®至强®6处理器或第五代AMD EPYC™ 9005系列处理器,在1U空间实现计算性能、存储密度、扩展能力的设计,提供业界丰富的多层存储矩阵,适用于高速计算,高频交易、虚拟化等多种计算密集型场景。

浪潮NF3280 G8服务器是扩展型高性价比2U单路机架式服务器系列,支持新的AMD EPYC™ 9005系列处理器。该系列产品具备多核心、高主频、大缓存、高扩展的特性,发挥单处理器性能,2U空间实现存储、扩展设计,适用于云计算/虚拟化、大数据、分布式存储、视频转码、推理和训练等应用场景,提升TCO收益。