字符串复制#
- group 复制
函数
-
std::unique_ptr<string_scalar> repeat_string(string_scalar const &input, size_type repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#
将给定的字符串标量重复给定的次数。
通过将输入字符串重复由
repeat_times
参数指定的次数来生成输出字符串标量。特殊情况
如果
repeat_times
不是正值,将返回一个空的(有效的)字符串标量。无论
repeat_times
参数的值如何,无效的输入标量始终会导致无效的输出标量。
Example: s = '123XYZ-' out = repeat_strings(s, 3) out is '123XYZ-123XYZ-123XYZ-'
- 抛出:
std::overflow_error – 如果输出字符串标量的大小超过标量可存储的最大值:
input.size() * repeat_times > max of size_type
- 参数:
input – 包含要重复的字符串的标量
repeat_times – 输入字符串重复的次数
stream – 用于设备内存操作和内核启动的 CUDA 流
mr – 用于分配返回的字符串标量的设备内存资源
- 返回:
重复输入字符串后的新字符串标量
-
std::unique_ptr<column> repeat_strings(strings_column_view const &input, size_type repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#
将给定字符串列中的每个字符串重复给定的次数。
通过将输入字符串列中的每个字符串重复由
repeat_times
参数指定的次数来生成输出字符串列。特殊情况
如果
repeat_times
不是正数,则非空输入字符串始终会生成空输出字符串。无论
repeat_times
参数的值如何,空输入字符串始终会导致空输出字符串。
Example: strs = ['aa', null, '', 'bbc'] out = repeat_strings(strs, 3) out is ['aaaaaa', null, '', 'bbcbbcbbc']
- 参数:
input – 包含要重复的字符串的列
repeat_times – 每个输入字符串重复的次数
stream – 用于设备内存操作和内核启动的 CUDA 流
mr – 用于分配返回的字符串列的设备内存资源
- 返回:
包含重复字符串的新列
-
std::unique_ptr<column> repeat_strings(strings_column_view const &input, column_view const &repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#
将给定字符串列中的每个字符串重复另一个数字列中给定的次数。
通过将每个输入字符串重复
repeat_times
数字列中相应行指定的次数来生成输出字符串列。特殊情况
任何空行(无论是来自输入字符串列还是
repeat_times
列)始终会导致输出字符串为空。如果
repeat_times
列中的任何值不是正数,并且其对应的输入字符串不为空,则输出字符串将为空字符串。
Example: strs = ['aa', null, '', 'bbc-'] repeat_times = [ 1, 2, 3, 4 ] out = repeat_strings(strs, repeat_times) out is ['aa', null, '', 'bbc-bbc-bbc-bbc-']
- 抛出:
cudf::logic_error – 如果输入的
repeat_times
不是整数类型cudf::logic_error – 如果输入列大小不同。
- 参数:
input – 包含要重复的字符串的列
repeat_times – 包含对应行输入字符串重复次数的列
stream – 用于设备内存操作和内核启动的 CUDA 流
mr – 用于分配返回的字符串列的设备内存资源
- 返回:
包含重复字符串的新列。
-
std::unique_ptr<string_scalar> repeat_string(string_scalar const &input, size_type repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#