jaccard#

pylibcudf.nvtext.jaccard.jaccard_index(Column input1, Column input2, size_type width) Column#

返回两个字符串列中单个行之间的 Jaccard 相似度。

详情请参阅 jaccard_index()

参数:
input1Column

输入字符串列

input2Column

输入字符串列

widthsize_type

要生成的 n-gram 数量

返回:

索引计算值