Jaccard 相似度#

Jaccard 相似度定义为两个集合交集的大小与它们并集大小的比率。

Jaccard 相似度可以定义为

\[ S_j = \frac{|A \cap B|}{|A \cup B|} \]

在图中,这些集合指的是节点 A 和 B 的连接节点集或邻域。

了解更多关于 Jaccard 相似度的信息

何时使用 Jaccard 相似度#

  • 你想确定图中的两个节点是否属于相似的社区。

  • 你想比较两个图的结构。

  • 你有一组图,并想将它们归类为特定类型

何时不使用 Jaccard 相似度#

  • 在有向图中

  • 在非常大的稀疏图中

  • 节点度数差异很大的图

计算成本如何?#

虽然 cuGraph 的并行性降低了运行成本,但大 O 符号仍然是比较算法成本的标准。

计算图的 Jaccard 相似度的成本是 O(d * n),其中 d 是节点的平均度数,n 是节点的数量。


版权所有 (c) 2023-2025, NVIDIA CORPORATION.

根据 Apache 许可证 2.0 版(“许可证”)获得许可;除非遵守许可证,否则您不得使用本文件。您可以在 https://apache.ac.cn/licenses/LICENSE-2.0 获取许可证的副本

除非适用法律要求或书面同意,否则根据许可证分发的软件按“原样”分发,不提供任何明示或默示的保证或条件。请参阅许可证以了解管理权限和限制的特定语言。