Microsoft Azure#
Azure 虚拟机
启动一个 Azure VM 实例并运行 RAPIDS。
单节点
Azure Kubernetes Service (AKS)
在托管的 Kubernetes 上启动一个 RAPIDS 集群。
多节点
通过 Dask 的 Azure 集群
在 Azure VM 或 Azure ML 上使用 Dask 启动 RAPIDS 集群。
多节点
Azure Machine Learning (Azure ML)
在 Azure ML 上启动 RAPIDS 实验。
单节点 多节点
RAPIDS 可以通过多种方式部署在 Microsoft Azure 上。Azure 支持各种类型的 GPU VM 以满足不同的需求。对于 RAPIDS 用户,我们推荐使用 NC/ND VM,它们是针对计算和深度学习进行优化的实例。
NC (>=v3) 系列
大小 |
vCPU |
内存:GiB |
临时存储 (含 NVMe) : GiB |
GPU |
GPU 显存:GiB |
最大数据磁盘数 |
最大非缓存磁盘吞吐量:IOPS / MBps |
最大网卡数/网络带宽 (MBps) |
---|---|---|---|---|---|---|---|---|
Standard_ND96isr_H100_v5 |
96 |
1900 |
1000 |
8 |
80 |
32 |
40800/612 |
8/80,000 |
Standard_NC24ads_A100_v4 |
24 |
220 |
1123 |
1 |
80 |
12 |
30000/1000 |
2/20,000 |
Standard_NC48ads_A100_v4 |
48 |
440 |
2246 |
2 |
160 |
24 |
60000/2000 |
4/40,000 |
Standard_NC96ads_A100_v4 |
96 |
880 |
4492 |
4 |
320 |
32 |
120000/4000 |
8/80,000 |
Standard_NC4as_T4_v3 |
4 |
28 |
180 |
1 |
16 |
8 |
2 / 8000 |
|
Standard_NC8as_T4_v3 |
8 |
56 |
360 |
1 |
16 |
16 |
4 / 8000 |
|
Standard_NC16as_T4_v3 |
16 |
110 |
360 |
1 |
16 |
32 |
8 / 8000 |
|
Standard_NC64as_T4_v3 |
64 |
440 |
2880 |
4 |
64 |
32 |
8 / 32000 |
|
Standard_NC6s_v3 |
6 |
112 |
736 |
1 |
16 |
12 |
20000/200 |
4 |
Standard_NC12s_v3 |
12 |
224 |
1474 |
2 |
32 |
24 |
40000/400 |
8 |
Standard_NC24s_v3 |
24 |
448 |
2948 |
4 |
64 |
32 |
80000/800 |
8 |
Standard_NC24rs_v3* |
24 |
448 |
2948 |
4 |
64 |
32 |
80000/800 |
8 |
* 支持 RDMA
ND (>=v2) 系列
大小 |
vCPU |
内存:GiB |
临时存储 (含 NVMe) : GiB |
GPU |
GPU 显存:GiB |
最大数据磁盘数 |
最大非缓存磁盘吞吐量:IOPS / MBps |
最大网卡数/网络带宽 (MBps) |
---|---|---|---|---|---|---|---|---|
Standard_ND96asr_v4 |
96 |
900 |
6000 |
8 个 A100 40 GB GPU (NVLink 3.0) |
40 |
32 |
80,000 / 800 |
8/24,000 |
Standard_ND96amsr_A100_v4 |
96 |
1900 |
6400 |
8 个 A100 80 GB GPU (NVLink 3.0) |
80 |
32 |
80,000 / 800 |
8/24,000 |
Standard_ND40rs_v2 |
40 |
672 |
2948 |
8 个 V100 32 GB (NVLink) |
32 |
32 |
80,000 / 800 |
8/24,000 |