RAPIDS 精选用户指南

RAPIDS 数据科学框架是一个库集合,用于完全在 GPU 上运行端到端的数据科学流水线。交互设计为与 Python 中的工作方式相似的观感,但在底层利用了优化的 NVIDIA® CUDA® 原语和高带宽 GPU 内存。下面是一些链接,可帮助您开始使用各个 RAPIDS 库。

社区 Notebooks: 示例和教程集合,用于向新用户介绍 RAPIDS 的功能和特性。

RAPIDS Cloud 的机器学习服务集成: 包含示例 notebooks 和“入门”代码样本的存储库,帮助您将 RAPIDS 与 Azure ML、AWS Sagemaker、Google Cloud 和 Databricks 的超参数优化服务集成。

RAPIDS 部署 工具和指南: 部署文档,帮助您在 AWS、GCP、Azure、IBM 等环境中启动和运行 RAPIDS。还包括 HPC、HPO、Kubernetes、Dask 等指南。

使用 cuDF 进行 ETL 和数据框处理: 从 10 分钟掌握 cuDF 和 Dask-cuDF 用户指南 开始。仿照 10 分钟掌握 Pandas 设计,这是 cuDF 的简短介绍,主要面向新用户。cuDF 用户指南 通常非常全面且有用。

使用 cuML 加速机器学习: 从 用户指南Estimator 介绍 开始,展示 cuML 中用于训练和评估机器学习模型的基本机器学习功能。cuML 介绍和关键概念 也很有帮助。

使用 cuGraph 进行图分析: 从 简易路径 开始,使用 NetworkX 图对象和加速算法。或者,使用 nx-cugraph 在无需代码更改的情况下使用 NetworkX API 和 GPU 加速后端。还有一个通用的 cuGraph 介绍

使用 cuSpatial 进行空间分析: 从 cuSpatial 用户指南 开始,了解 GPU 加速空间分析的介绍。

使用 cuxfilter 加速交叉过滤可视化: 从 10 分钟掌握 Cuxfilter 开始,了解如何快速创建仪表板的概述。在 RAPIDS 可视化指南 中也有更广泛的示例。

使用 cuCIM 进行计算机视觉和分析: 从 欢迎 Notebook 开始,了解资源指南链接和项目结构的良好概述。

使用 RAFT 进行科学计算、数据科学和机器学习的算法和原语: 从 快速入门 指南开始,查看简单的 Python 和 C++ 示例。

使用 Spark RAPIDS 加速 Apache Spark: 从 示例存储库 开始,获取使用 RAPIDS Accelerator 的 Spark 相关实用程序和示例,包括 ETL、ML/DL 等。在其文档介绍中提供了良好的 概述