服务器、存储、网络产品购买热线:400-860-6708 ERP、管理软件购买热线:400-018-7700云服务产品销售热线:400-607-6657

AIStation 训练平台可满足企业深度学习需求

2020-08-20
分享到

AIStation 是浪潮自主研发的人工智能开发平台,面向深度学习开发场景,整合计算资源、数据资源以及AI开发环境,实现计算资源统一分配调度、训练数据集中管理并加速、模型流程化开发训练,为AI 研发构建敏捷高效的一体化平台。支持具有资源池化特性的GPU服务器,可以实现跨节点资源分配,便于云平台GPU池化管理。为了帮助大家可以更好的了解AIStation 训练平台,这里进行产品介绍。

112

在训练数据管理方面,统一管理个人数据及开发数据集,支持数据共享协同。对接企业数据存储系统,支持NFS、HDFS、BeeGFS等文件系统。支持文件上传、下载、压缩、解压、新建和删除等。支持用户访问及下载权限设置,保证数据安全可靠。

在AI计算资源集中管理调度方面,GPU服务器及GPU卡池化管理,使用状态一览展示。GPU资源使用情况实时统计分析。开发用户按需申请资源、动态分配。GPU多维细粒度调度。智能化资源调度策略。

在GPU性能监控方面,AI服务器性能及状态监控,CPU利用率、MEM利用率、网络IO、IB流量、磁盘分区、节点负载。GPU性能监控,GPU利用率、显存利用率、时钟频率、功耗、温度。存储系统及磁盘分区使用监控,各用户存储使用量监控。

在AI计算资源运维管理方面,实时统计用户组/用户资源使用。实时查看计算节点资源占用情况。管理员控制各用户资源使用配额。管理员快速清理回收资源,再分配。

在交互式模型开发训练过程方面,集成主流AI开发框架。打通数据集、计算资源、框架工具。提供丰富完整的AI开发工具链。对接pycharm、vscode等IDE工具。

在分布式训练任务编排方面,不同深度学习框架模板,通过模板快速提交训练任务。多机分布式任务跨节点自动分配计算资源,自动编排计算进程。按需申请计算资源的CPU核数和GPU卡数内存和训练集等。提供CLI方式任务提交及管。

相关推荐

关于浪潮

集团简介 企业文化 董事长致辞 加入我们 联系我们 关注我们

新闻与活动

新闻公告 市场活动 科技战“疫”

如何购买

需求工单 售前咨询 查找经销商

探索浪潮

通用服务器 存储 人工智能 爱城市网 浪潮云 浪潮云ERP

支持与服务

支持下载 视频中心 服务进度查询 安全通告

快速链接

合作伙伴生态 电子采购平台 投行项目 投资者关系 道德遵从

在社交媒体上关注我们

拨打咨询电话