字节对编码#

class pylibcudf.nvtext.byte_pair_encode.BPEMergePairs#

BPE 编码器的合并对表。

有关详细信息,请参阅 cudf::nvtext::bpe_merge_pairs

pylibcudf.nvtext.byte_pair_encode.byte_pair_encoding(Column input, BPEMergePairs merge_pairs, Scalar separator=None) Column#

对输入字符串进行字节对编码。

有关详细信息,请参阅 cpp:func:cudf::nvtext::byte_pair_encoding

参数:
inputColumn

要编码的字符串。

merge_pairsBPEMergePairs

用于重构每个字符串的子字符串。

separatorScalar

编码后用于构建输出的字符串。默认为空格。

返回值:

编码后的字符串列。