generate_ngrams#

pylibcudf.nvtext.generate_ngrams.generate_character_ngrams(Column input, size_type ngrams=2) Column#

返回一个列表列,其中包含每个字符串内的字符 n-gram。

详情请参见 generate_character_ngrams()

参数:
inputColumn

输入字符串

ngramsize_type

要生成的 n-gram 数

返回值:
Column

字符串列表列

pylibcudf.nvtext.generate_ngrams.generate_ngrams(Column input, size_type ngrams, Scalar separator) Column#

通过从字符串列生成 n-gram 来返回单个字符串列。

详情请参见 generate_ngrams()

参数:
inputColumn

输入字符串

ngramsize_type

要生成的 n-gram 数

separatorScalar

用于分隔 n-gram 标记的字符串

返回值:
Column

包含标记的新字符串列

pylibcudf.nvtext.generate_ngrams.hash_character_ngrams(Column input, size_type ngrams, uint32_t seed) Column#

返回一个列表列,其中包含每个字符串中字符的哈希值

详情请参见 hash_character_ngrams()

参数:
inputColumn

输入字符串

ngramsize_type

要生成的 n-gram 数

seeduint32_t

用于哈希算法的种子

返回值:
Column

哈希值列表列