Jaccard 相似度#
Jaccard 相似度定义为两个集合交集的大小与它们并集大小的比率。
Jaccard 相似度可以定义为
\[ S_j = \frac{|A \cap B|}{|A \cup B|} \]
在图中,这些集合指的是节点 A 和 B 的连接节点集或邻域。
何时使用 Jaccard 相似度#
你想确定图中的两个节点是否属于相似的社区。
你想比较两个图的结构。
你有一组图,并想将它们归类为特定类型
何时不使用 Jaccard 相似度#
在有向图中
在非常大的稀疏图中
节点度数差异很大的图
计算成本如何?#
虽然 cuGraph 的并行性降低了运行成本,但大 O 符号仍然是比较算法成本的标准。
计算图的 Jaccard 相似度的成本是 O(d * n),其中 d 是节点的平均度数,n 是节点的数量。
版权所有 (c) 2023-2025, NVIDIA CORPORATION.
根据 Apache 许可证 2.0 版(“许可证”)获得许可;除非遵守许可证,否则您不得使用本文件。您可以在 https://apache.ac.cn/licenses/LICENSE-2.0 获取许可证的副本
除非适用法律要求或书面同意,否则根据许可证分发的软件按“原样”分发,不提供任何明示或默示的保证或条件。请参阅许可证以了解管理权限和限制的特定语言。