AIStation 是浪潮自主研发的人工智能开发平台,面向深度学习开发场景,整合计算资源、数据资源以及AI开发环境,实现计算资源统一分配调度、训练数据集中管理并加速、模型流程化开发训练,为AI 研发构建敏捷高效的一体化平台。支持具有资源池化特性的GPU服务器,可以实现跨节点资源分配,便于云平台GPU池化管理。为了帮助大家可以更好的了解AIStation 训练平台,这里进行产品介绍。
在训练数据管理方面,统一管理个人数据及开发数据集,支持数据共享协同。对接企业数据存储系统,支持NFS、HDFS、BeeGFS等文件系统。支持文件上传、下载、压缩、解压、新建和删除等。支持用户访问及下载权限设置,保证数据安全可靠。
在AI计算资源集中管理调度方面,GPU服务器及GPU卡池化管理,使用状态一览展示。GPU资源使用情况实时统计分析。开发用户按需申请资源、动态分配。GPU多维细粒度调度。智能化资源调度策略。
在GPU性能监控方面,AI服务器性能及状态监控,CPU利用率、MEM利用率、网络IO、IB流量、磁盘分区、节点负载。GPU性能监控,GPU利用率、显存利用率、时钟频率、功耗、温度。存储系统及磁盘分区使用监控,各用户存储使用量监控。
在AI计算资源运维管理方面,实时统计用户组/用户资源使用。实时查看计算节点资源占用情况。管理员控制各用户资源使用配额。管理员快速清理回收资源,再分配。
在交互式模型开发训练过程方面,集成主流AI开发框架。打通数据集、计算资源、框架工具。提供丰富完整的AI开发工具链。对接pycharm、vscode等IDE工具。
在分布式训练任务编排方面,不同深度学习框架模板,通过模板快速提交训练任务。多机分布式任务跨节点自动分配计算资源,自动编排计算进程。按需申请计算资源的CPU核数和GPU卡数内存和训练集等。提供CLI方式任务提交及管。
©1996 - 2020 INSPUR Co., Ltd. 鲁ICP备05019369号
服务器、存储、网络产品购买热线:
ERP、管理软件购买热线:
云服务产品销售热线:
浪潮网络售后热线: