立即咨询
FusionSpace超聚变AI开发平台
  • 首页
  • 产品与解决方案
  • FusionSpace超聚变AI开发平台

    产品介绍

    超聚变FusionSpace大模型训练解决方案集成了AI开发平台、AI加速软件栈、资源编排和调度等一系列软件与服务,以及计算、网络和存储等AI基础设施。为企业使能AI提供了更高效、更可靠的解决方案,提升大模型的研发效率,同时保障了模型训练过程的可靠性,助力企业实现数字化转型和智能化升级。

    https://www.xfusion.com/wp-content/uploads/2023/12/FusionSpace-AI开发平台.png

    产品亮点

    开放

    开放

    GPU、NPU等多算力资源统一调度、统一管理,通过节点标签定义各类资源池,AI任务可灵活选择最匹配的资源池

    GPU节点可以通过裸金属服务在多个租户资源池中跨集群弹性调度,实现资源共享

    提供REST、SNMP等标准北向接口,方便被客户自有系统集成

    高效

    高效

    增强作业调度,支持Gang、Binpack、Proportion、Priority等高阶调度策略,资源利用率提升50%以上

    GPU/NPU多实例和虚拟化技术,单卡可以当多卡使用,有效降低客户TCO

    Checkpoint时长低至30秒,快速保存训练过程中的数据,训练时长最多可缩短6%

    可靠

    可靠

    自动识别作业是否卡死,告警提醒用户及时释放资源,节省训练资源成本

    训练过程中检测到节点故障、计算资源耗尽、程序崩溃等故障后自动从最近的Checkpoint点恢复训练,训练任务秒级恢复

    通过BMC和多种诊断工具,支持集群的GPU故障监控和诊断,故障诊断准确率达96%

    易用

    易用

    集成数据管理、算法开发、训练管理、模型管理、推理服务、镜像管理等多个功能模块,一站式AI模型开发训练部署,打通深度学习全链路

    预置常见预训练模型和深度学习框架镜像,帮助用户快速开发AI应用

    集成模型迁移工具,实现模型快速迁移和可视化性能分析,助力客户业务快速上线

    方案架构

    FusionSpace超聚变AI开发平台方案架构
    FusionSpace超聚变AI开发平台方案架构

    推荐产品

    技术支持

    FusionSpace产品文档
    产品文档
    当前产品介绍、安装部署和维护等文档
    FusionSpace软件下载
    软件下载
    产品配套的驱动程序、相关固件下载
    FusionSpace案例库
    案例库
    产品相关的各类优秀实践、故障处理、运维技巧等的集合

    如何购买

    销售回电

    销售回电

    欢迎在线留下项目诉求,我们将会有工作人员与你取得联系

    在线咨询

    在线咨询

    如果你对我们的企业产品或服务感兴趣,或有遇到问题,请联系我们的在线工作人员

    电话热线

    电话热线

    如果你需要购买我们的企业产品或服务,请立即拨打以下电话,我们的工作人员将及时与你对接

    400-080-6888