cuGraph Notebooks#

GraphAnalyticsFigure

此仓库包含一系列 Jupyter Notebooks,概述了如何运行各种 cuGraph 分析。这些 Notebooks 并未解决完整的数据科学问题。它们只是演示如何运行图分析的示例。这里不涉及在图分析之前或之后的数据处理。目前正在创建更多、更侧重于解决问题的 Notebooks,可在 https://github.com/rapidsai/notebooks-extended 查看。

摘要#

文件夹 Notebook 描述
中心性
中心性 计算并比较多个(当前为 5 个)中心性得分
Katz 计算每个顶点的 Katz 中心性
介数 计算边介数中心性和顶点介数中心性
计算每个顶点的度中心性
特征向量 计算每个顶点的特征向量
社区
Louvain 和 Leiden 使用 Louvain 和 Leiden 算法识别图中的簇
ECG 使用图的集成聚类 (Ensemble Clustering for Graph) 算法识别图中的簇
K-Truss 提取 K-Truss 簇
谱聚类 使用谱聚类(结合以下方法)识别图中的簇
- 平衡割
- 模块度
子图提取 计算现有图的子图,仅包含指定的顶点
三角形计数 计算图中的三角形数量
分量
连通分量 查找图中的弱连通分量和强连通分量
K-核 提取 K-核 簇
核数 计算图中的每个顶点的核数
布局
Force-Atlas2 使用 cuGraph 实现的大图可视化。
链接分析
PageRank 计算图中的每个顶点的 PageRank
HITS 计算图中的每个顶点的 HITS Hub 和 Authority 分数
链接预测
Jaccard 相似度 使用以下两种方法计算顶点相似度得分
- Jaccard 相似度
- 加权 Jaccard
重叠相似度 使用重叠系数计算顶点相似度得分
采样
随机游走 计算不同种子数量和路径长度的随机游走
遍历
BFS 计算图中从起始顶点到所有其他顶点的广度优先搜索路径
SSSP 单源最短路径 (Single Source Shortest Path) - 计算从起始顶点到所有其他顶点的最短路径
结构
重新编号
重新编号 2
重新编号图中的顶点 ID(两个示例 Notebooks)
对称化 对称化图中的边

RAPIDS Notebooks#

访问主 RAPIDS notebooks 仓库,获取所有 RAPIDS 库的 Notebooks 列表。

要求#

运行这些 Notebooks 中的示例需要

  • 最新版本的包含 cuGraph 的 RAPIDS。

  • cuGraph 依赖于最新版本的 cuDF。请安装 RAPIDS 的所有组件

  • Python 3.10+

  • 具有 NVIDIA GPU 的系统:Volta 架构或更新版本

  • CUDA 11.4+