Microsoft Azure#

Azure 虚拟机

启动一个 Azure VM 实例并运行 RAPIDS。

单节点

Azure 虚拟机

Azure Kubernetes Service (AKS)

在托管的 Kubernetes 上启动一个 RAPIDS 集群。

多节点

Azure Kubernetes Service

通过 Dask 的 Azure 集群

在 Azure VM 或 Azure ML 上使用 Dask 启动 RAPIDS 集群。

多节点

Azure VM 集群 (通过 Dask)

Azure Machine Learning (Azure ML)

在 Azure ML 上启动 RAPIDS 实验。

单节点 多节点

Azure Machine Learning

RAPIDS 可以通过多种方式部署在 Microsoft Azure 上。Azure 支持各种类型的 GPU VM 以满足不同的需求。对于 RAPIDS 用户,我们推荐使用 NC/ND VM,它们是针对计算和深度学习进行优化的实例。

NC (>=v3) 系列

大小

vCPU

内存:GiB

临时存储 (含 NVMe) : GiB

GPU

GPU 显存:GiB

最大数据磁盘数

最大非缓存磁盘吞吐量:IOPS / MBps

最大网卡数/网络带宽 (MBps)

Standard_ND96isr_H100_v5

96

1900

1000

8

80

32

40800/612

8/80,000

Standard_NC24ads_A100_v4

24

220

1123

1

80

12

30000/1000

2/20,000

Standard_NC48ads_A100_v4

48

440

2246

2

160

24

60000/2000

4/40,000

Standard_NC96ads_A100_v4

96

880

4492

4

320

32

120000/4000

8/80,000

Standard_NC4as_T4_v3

4

28

180

1

16

8

2 / 8000

Standard_NC8as_T4_v3

8

56

360

1

16

16

4 / 8000

Standard_NC16as_T4_v3

16

110

360

1

16

32

8 / 8000

Standard_NC64as_T4_v3

64

440

2880

4

64

32

8 / 32000

Standard_NC6s_v3

6

112

736

1

16

12

20000/200

4

Standard_NC12s_v3

12

224

1474

2

32

24

40000/400

8

Standard_NC24s_v3

24

448

2948

4

64

32

80000/800

8

Standard_NC24rs_v3*

24

448

2948

4

64

32

80000/800

8

* 支持 RDMA

ND (>=v2) 系列

大小

vCPU

内存:GiB

临时存储 (含 NVMe) : GiB

GPU

GPU 显存:GiB

最大数据磁盘数

最大非缓存磁盘吞吐量:IOPS / MBps

最大网卡数/网络带宽 (MBps)

Standard_ND96asr_v4

96

900

6000

8 个 A100 40 GB GPU (NVLink 3.0)

40

32

80,000 / 800

8/24,000

Standard_ND96amsr_A100_v4

96

1900

6400

8 个 A100 80 GB GPU (NVLink 3.0)

80

32

80,000 / 800

8/24,000

Standard_ND40rs_v2

40

672

2948

8 个 V100 32 GB (NVLink)

32

32

80,000 / 800

8/24,000