浪潮信息宣布推出元脑CPU推理服务器,可运行DeepSeek和千问QwQ等新一代大推理模型。浪潮元脑CPU推理服务器NF8260G7和NF8480G7设计采用4颗高性能通用CPU和多通道内存系统,通过张量并行策略和AMX加速技术。
单机即可高 效运行DeepSeek-R1 32B和QwQ-32B推理模型,单用户性能超20 tokens/s,可同时处理20个并发用户请求,是企业快速、易获得、低投入部署上线大模型平台的理想算力选择,将加速DeepSeek带动下AI落地普及速度。
目前浪潮元脑CPU推理服务器NF8260G7和NF8480G7基于通用处理器架构进行软硬协同优化,已经完成与DeepSeek-R1 32B和QwQ-32B等大模型的深度适配和优化。元脑CPU推理服务器通过采用张量并行策略和AMX加速技术,业界主流企业级大模型推理服务框架,实现多处理器并行计算,并使用AWQ(激活感知权重量化)技术,进一步提升推理解码性能,成功实现单用户20tokens/s的性能,为企业的AI大模型部署应用带来流畅体验。
面对CPU服务器部署大模型面临算力和带宽方面的挑战,浪潮元脑CPU推理服务器采用了多项创新技术。

浪潮NF5466 G8服务器是4U双路存储优化服务器,兼顾高存储容量、强大计算性能和智能运维、节能,非常适用于温冷数据存储、视频存储、大数据存储、云存储池搭建、CDN缓存、数据迁移备份等应用场景。

浪潮NF5280 G8服务器是主流2U双路机架式服务器系列,支持英特尔®至强®6处理器(SP及AP均可支持)或第五代AMD EPYC™9005系列处理器。该系列产品在计算性能、存储性能、可扩展性方面均实现良好设计,支持前IO、液冷等多元部署方式,融合CXL 2.0等诸多技术落地,为业务细分场景提供差异化优能效比算力支撑,以百变形态实现通用场景全覆盖。

浪潮NF5180 G8服务器是1U2S高密计算型服务器系列,1U空间可搭载2颗TDP的英特尔®至强®6处理器或第五代AMD EPYC™ 9005系列处理器,在1U空间实现计算性能、存储密度、扩展能力的设计,提供业界丰富的多层存储矩阵,适用于高速计算,高频交易、虚拟化等多种计算密集型场景。

浪潮NF3280 G8服务器是扩展型高性价比2U单路机架式服务器系列,支持新的AMD EPYC™ 9005系列处理器。该系列产品具备多核心、高主频、大缓存、高扩展的特性,发挥单处理器性能,2U空间实现存储、扩展设计,适用于云计算/虚拟化、大数据、分布式存储、视频转码、推理和训练等应用场景,提升TCO收益。