微众银行面向AI智算场景推出金融业首款自研交流机 (微众银行面向未来微众人行动纲领免费阅读)

admin1 2周前 (01-23) 阅读数 65 #银行

近日,微众银行推出金融行业AI智算场景首款自研交流机,并首度披露高性能AI智算网络处置方案。该方案成功了AI智算场景下从配件层的交流机、到软件层的网络操作系统、再到智能网络管控的全链路自主可控。

目前,该款交流机已在微众银行消费运营环境正式投入经常经常使用,最高可满足400G GPU/NPU算力卡的组网需求,建网本钱节省约70%,为微众银行迈向AI原生奠定关键基础。

大模型时代,基于的AI散布式训练经常受限于“网络拥塞”。特地是在基于以太网展开的AI散布式训练中,由于流量的低熵特性,传统多链路等价负载分担容易构成网络拥塞,无法满足金融业对高带宽、低时延、零丢包的严苛要求。假定依赖外部商用单点优化处置方案,不只本钱高昂,且无法高效、系统、片面地优化更新。

面对这一难题,微众银行另辟蹊径,深度拆解自身业务展开需求,面向AI智算场景,打造软配件全栈自主可控的高性能AI智算网络处置方案,成功软配件解耦与灵敏组合性能。

配件方面,微众银行基于12.8T国产交流芯片和国产CPU打造专属交流机,适配国际外支流GPU和NPU计算资源。交流机支持高达1.6T的RDMA(Remote Direct Memory Access,即“远程直接内存访问”)接入才干,最高能够支撑400G 的GPU/NPU算力卡在无损以太网环境下的组网需求,为金融行业在AI算力卡选型上拓展了更多或许性。

软件方面,微众银行基于开源的SONiC(Software for Open Networking in The Cloud,即“云中开通网络软件”)自研网络操作系统,创新性研发顺应不同组网架构、可自定义的链路级负载分担组件,使得大规模部署无损以太网更丝滑。如若链路出现缺陷,该组件能够在毫秒之间将流量切换至备份链路上,极大缩充足点影响范围与时长。

值得一提的是,针对日常AI训练环节,如何加快发现网络拥塞并妥当处置极为关键。为此,微众银行在软件层进一步自研智能网络管控系统,为AI智算网络提供智能化调度的“全知视角”,成功全网设备拥塞目的秒级采集监控,精准定位拥塞业务流量,并智能调度至最优途径。

此前,微众银行在运行开源SONiC自研网络操作系统的同时,将网络协议性能优化方案开源反哺SONiC社区,成为上榜SONiC官方奉献组织名单的独一金融机构,助力中国金融科技优化国际影响力。下一步,微众银行将继续迭代AI智算网络处置方案,总结提炼在智能网络管控方面的成熟阅历,方案未来构成规范化公共组件面向全球开源共享,助力AI智算网络高质量展开。

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门