replace#

pylibcudf.nvtext.replace.filter_tokens(Column input, size_type min_token_length, Scalar replacement=None, Scalar delimiter=None) Column#

移除长度小于指定字符数的标记。

详情请参阅 filter_tokens()

参数:
inputColumn

要替换的字符串列

min_token_lengthsize_type

在输出字符串中保留标记所需的最小字符数

replacementScalar, optional

用于替换已移除标记的可选字符串

delimiterScalar, optional

用于将每个字符串分隔成标记的字符。空字符串的默认值将使用空白字符识别标记。

返回
——-
Column

过滤后的新字符串列

pylibcudf.nvtext.replace.replace_tokens(Column input, Column targets, Column replacements, Scalar delimiter=None) Column#

用相应的替换字符串替换指定的标记。

详情请参阅 replace_tokens()

参数:
inputColumn

要替换的字符串列

targetsColumn

用于与input中找到的标记进行比较的字符串

replacementsColumn

targets中每个字符串的替换字符串

delimiterScalar, optional

用于将每个字符串分隔成标记的字符。空字符串的默认值将使用空白字符识别标记。

返回:
Column

替换了字符串的新字符串列