generate_ngrams#
- pylibcudf.nvtext.generate_ngrams.generate_character_ngrams(Column input, size_type ngrams=2) Column #
返回一个列表列,其中包含每个字符串内的字符 n-gram。
详情请参见
generate_character_ngrams()
- 参数:
- inputColumn
输入字符串
- ngramsize_type
要生成的 n-gram 数
- 返回值:
- Column
字符串列表列
- pylibcudf.nvtext.generate_ngrams.generate_ngrams(Column input, size_type ngrams, Scalar separator) Column #
通过从字符串列生成 n-gram 来返回单个字符串列。
详情请参见
generate_ngrams()
- 参数:
- inputColumn
输入字符串
- ngramsize_type
要生成的 n-gram 数
- separatorScalar
用于分隔 n-gram 标记的字符串
- 返回值:
- Column
包含标记的新字符串列
- pylibcudf.nvtext.generate_ngrams.hash_character_ngrams(Column input, size_type ngrams, uint32_t seed) Column #
返回一个列表列,其中包含每个字符串中字符的哈希值
详情请参见
hash_character_ngrams()
- 参数:
- inputColumn
输入字符串
- ngramsize_type
要生成的 n-gram 数
- seeduint32_t
用于哈希算法的种子
- 返回值:
- Column
哈希值列表列