首款国产全栈自研IB 中科曙光发布scaleFabric高速网络:打破NV垄断

久久百科 网络资讯 1

3月12日消息,AI基建除了需要高性能GPU等计算芯片之外,网络芯片也成为核心,NVIDIA的AI护城河就包括了InfiniBand(简称IB)解决方案,现在国产全栈自研的IB芯片也来了。

今天中科曙光发布了国产InfiniBand原生无损RDMA高速网络scaleFabric,在AI大模型万卡集群训练中,可实现典型AI训练任务网络效率大幅提升,缩短模型训练周期,在性能方面对标国际顶尖IB产品,成本较市面IB方案降低约30%。

根据官方数据,scaleFabric端到端时延低至0.9微秒,交换时延约260ns,与NVIDIA NDR相比,交换机端口密度提升25%,网卡最大QP数支持提升100%,单子网互连规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低30%。

中国工程院院士邬贺铨表示,scaleFabric是国内首款全栈自主研发的400G原生RDMA高速网络系统,性能对标国际主流,且经规模化实践验证,补齐了国产高速网络的短板。

这套IB网络系统实际上已经在国家超算互联网郑州核心节点,今年初中科曙光的3套万卡超集群已经在这里上线试运行,已累计为超万名用户提供算力服务,并且网络总体成本降低30%,未来可将集群规模轻松扩展至10万卡以上。