字符串复制#

group 复制

函数

std::unique_ptr<string_scalar> repeat_string(string_scalar const &input, size_type repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#

将给定的字符串标量重复给定的次数。

通过将输入字符串重复由 repeat_times 参数指定的次数来生成输出字符串标量。

特殊情况

  • 如果 repeat_times 不是正值,将返回一个空的(有效的)字符串标量。

  • 无论 repeat_times 参数的值如何,无效的输入标量始终会导致无效的输出标量。

Example:
s   = '123XYZ-'
out = repeat_strings(s, 3)
out is '123XYZ-123XYZ-123XYZ-'
抛出:

std::overflow_error – 如果输出字符串标量的大小超过标量可存储的最大值:input.size() * repeat_times > max of size_type

参数:
  • input – 包含要重复的字符串的标量

  • repeat_times – 输入字符串重复的次数

  • stream – 用于设备内存操作和内核启动的 CUDA 流

  • mr – 用于分配返回的字符串标量的设备内存资源

返回:

重复输入字符串后的新字符串标量

std::unique_ptr<column> repeat_strings(strings_column_view const &input, size_type repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#

将给定字符串列中的每个字符串重复给定的次数。

通过将输入字符串列中的每个字符串重复由 repeat_times 参数指定的次数来生成输出字符串列。

特殊情况

  • 如果 repeat_times 不是正数,则非空输入字符串始终会生成空输出字符串。

  • 无论 repeat_times 参数的值如何,空输入字符串始终会导致空输出字符串。

Example:
strs = ['aa', null, '', 'bbc']
out  = repeat_strings(strs, 3)
out is ['aaaaaa', null, '', 'bbcbbcbbc']
参数:
  • input – 包含要重复的字符串的列

  • repeat_times – 每个输入字符串重复的次数

  • stream – 用于设备内存操作和内核启动的 CUDA 流

  • mr – 用于分配返回的字符串列的设备内存资源

返回:

包含重复字符串的新列

std::unique_ptr<column> repeat_strings(strings_column_view const &input, column_view const &repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#

将给定字符串列中的每个字符串重复另一个数字列中给定的次数。

通过将每个输入字符串重复 repeat_times 数字列中相应行指定的次数来生成输出字符串列。

特殊情况

  • 任何空行(无论是来自输入字符串列还是 repeat_times 列)始终会导致输出字符串为空。

  • 如果 repeat_times 列中的任何值不是正数,并且其对应的输入字符串不为空,则输出字符串将为空字符串。

Example:
strs         = ['aa', null, '', 'bbc-']
repeat_times = [ 1,   2,     3,  4   ]
out          = repeat_strings(strs, repeat_times)
out is ['aa', null, '', 'bbc-bbc-bbc-bbc-']
抛出:
参数:
  • input – 包含要重复的字符串的列

  • repeat_times – 包含对应行输入字符串重复次数的列

  • stream – 用于设备内存操作和内核启动的 CUDA 流

  • mr – 用于分配返回的字符串列的设备内存资源

返回:

包含重复字符串的新列。