软银集团旗下的infrinia团队已正式推出面向下一代ai数据中心的软件平台——“infrinia ai cloud os”。该平台依托智能化自动化技术,实现对gpu算力全栈(涵盖硬件层、系统层至应用层)的一体化统一管理,旨在高效响应生成式ai、智能机器人等前沿领域对gpu资源爆发式增长及高度异构化的需求。
Infrinia AI Cloud OS原生集成Kubernetes即服务(KaaS)能力,可全面支持包括英伟达GB200 NVL72在内的主流GPU硬件架构,并对BIOS固件、操作系统、GPU驱动、高速网络、Kubernetes控制平面及分布式存储等全链路组件实施自动化部署、配置与运维。
平台还具备基于软件定义的动态物理互连与内存虚拟重构能力:当用户发起集群创建或销毁操作时,系统可实时重配GPU节点间的物理连接拓扑与跨节点内存映射关系,并结合GPU硬件级拓扑结构智能调度节点资源,在保障低通信延迟的同时充分释放互联带宽,显著提升大规模分布式AI模型训练效率。
在多租户运行环境下,平台深度融合零信任安全理念,通过端到端加密通信、强隔离沙箱机制及细粒度权限管控,确保租户间数据与计算资源的绝对隔离;同时内置智能运维引擎,自动执行健康监

来电咨询