什么是 AI 训练平台
更新时间:2024-03-26 15:03:08
PDF
AI 算力平台是青云提供面向人工智能场景下的资源与服务业务,主要包含 GPU、并行文件存储、计算环境相关的业务,提供 AI 裸金属 GPU 主机和 AI 训练集群两个产品,租户隔离,提供安全、可靠边界的云上算法开发与训练环境。

资源介绍
GPU 卡类型 | 形式 | 规格 |
---|---|---|
A800 80G |
BM 主机 |
NVIDIA A800 80G*8 |
产品优势
-
极致算力
8 张 NVIDIA A800 80GB SXM4,结合高性能 CPU 为用户提供强劲算力。
-
极高网络性能
基于 Mellanox HDR InfiniBand 解决方案,支持 InfiniBand 无限带宽技术,具有极高的吞吐量和极低时延。
-
完美配套服务
服务器本地采用 NVMe 存储设备,支持挂载全闪并行文件存储 EPFS。独享互连网出口带宽。
-
弹性扩容
根据用户业务增长,可不间断业务的同时,弹性增加云上 AI 算力资源。
-
深度学习环境集成
集成 slurm 调度系统。
预置镜像集成 CUDA、Anaconda3、Python 等基础功能外,同时也集成 TensorFlow、PyTorch 等深度学习框架。