文件 | |
文件 | find.hpp |
文件 | find_multiple.hpp |
std::unique_ptr<column> cudf::strings::contains | ( | strings_column_view const & | input, |
string_scalar const & | target, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串包含目标字符串,则为 true。
如果在字符串中未找到 target
,则输出列中的对应条目返回 false。如果 target
是一个空字符串,则输出列中的所有非空条目返回 true。
任何空字符串条目在输出列中返回相应的空条目。
input | 用于此操作的字符串实例 |
target | 要在每个字符串中搜索的 UTF-8 编码字符串 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::contains | ( | strings_column_view const & | input, |
strings_column_view const & | targets, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串包含对应的目标字符串,则为 true。
如果字符串 targets[i]
在 input[i]
内找到,则 output[i] = true
,否则 output[i] = false
。如果 target[i]
是一个空字符串,则 output[i]
返回 true。如果 target[i]
为 null,则 output[i]
返回 false。
任何空字符串条目在输出列中返回相应的空条目。
cudf::logic_error | 如果 strings.size() != targets.size() 。 |
input | 用于此操作的字符串实例 |
targets | 在 strings 中按行检查的目标字符串列 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<table> cudf::strings::contains_multiple | ( | strings_column_view const & | input, |
strings_column_view const & | targets, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::mr::device_memory_resource * | mr = rmm::mr::get_current_device_resource() |
||
) |
在提供的列的每个字符串中搜索给定的目标字符串。
结果表中的每一列对应于相同序号的目标字符串的结果。即,第 0 列是第 0 个目标字符串的 BOOL8 列结果,第 1 列是第 1 个目标字符串的结果,以此类推。
如果在字符串中未找到目标,则输出列中的对应条目返回 false。如果目标是一个空字符串,则输出列中的所有非空条目返回 true。
任何空输入字符串在输出列中返回相应的空条目。
std::invalid_argument | 如果 targets 为空或包含 null |
input | 用于此操作的字符串实例 |
targets | 在 input 的每个字符串中搜索的 UTF-8 编码字符串 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::ends_with | ( | strings_column_view const & | input, |
string_scalar const & | target, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标字符串结尾,则为 true。
如果在字符串末尾未找到 target
,则输出列中的该行条目设置为 false。如果 target
是一个空字符串,则输出列中的所有非空条目返回 true。
任何空字符串条目在输出列中返回相应的空条目。
input | 用于此操作的字符串实例 |
target | 要在每个字符串中搜索的 UTF-8 编码字符串 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::ends_with | ( | strings_column_view const & | input, |
strings_column_view const & | targets, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标列中的对应字符串结尾,则为 true。
如果在 strings[i]
的字符串末尾未找到 targets[i]
,则输出列中的该行条目设置为 false。如果 targets[i]
是一个空字符串,则输出列中的相应条目返回 true。
targets
中的任何空字符串条目在输出列中返回相应的空条目。
cudf::logic_error | 如果 strings.size() != targets.size() 。 |
input | 用于此操作的字符串实例 |
targets | 用于此操作的字符串实例 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::find | ( | strings_column_view const & | input, |
string_scalar const & | target, | ||
size_type | start = 0 , |
||
size_type | stop = -1 , |
||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个字符位置值的列,其中目标字符串首先在提供的列的每个字符串中找到。
如果未找到 target
,则输出列中的该行条目返回 -1。
在每个字符串的字符位置范围 [start,stop) 内搜索目标字符串。如果 stop 参数为 -1,则每个字符串的末尾成为搜索包含的最终位置。
任何空字符串条目返回相应的空输出列条目。
cudf::logic_error | 如果 start 位置大于 stop 位置。 |
input | 用于此操作的字符串实例 |
target | 要在每个字符串中搜索的 UTF-8 编码字符串 |
start | 搜索包含的第一个字符位置 |
stop | 搜索包含的最后一个位置(不包含)。默认值 -1 将搜索到字符串的末尾。 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::find | ( | strings_column_view const & | input, |
strings_column_view const & | target, | ||
size_type | start = 0 , |
||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个字符位置值的列,其中目标字符串首先在提供的列的对应字符串中找到。
行 i
的输出是行 i
的目标字符串在输入字符串行 i
中从字符位置 start
开始的位置。如果在输入字符串中未找到目标,则输出列中的该行条目返回 -1。
任何空输入或目标条目返回相应的空输出列条目。
cudf::logic_error | 如果 input.size() != target.size() |
input | 要搜索的字符串 |
target | 在 input 中搜索的字符串 |
start | 搜索包含的第一个字符位置 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::find_multiple | ( | strings_column_view const & | input, |
strings_column_view const & | targets, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
在提供的列的每个字符串中搜索给定的目标字符串,并返回找到目标字符串的位置。
输出列的大小是 input.size()
。输出列的每一行的大小是 targets.size()
。
output[i,j]
包含 targets[j]
在 input[i]
中的位置
std::invalid_argument | 如果 targets 为空或包含 null |
input | 用于此操作的字符串实例 |
targets | 在每个字符串中搜索的字符串 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::rfind | ( | strings_column_view const & | input, |
string_scalar const & | target, | ||
size_type | start = 0 , |
||
size_type | stop = -1 , |
||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个字符位置值的列,其中目标字符串首先从每个字符串的末尾开始查找。
如果未找到 target
,则该条目返回 -1。
在每个字符串的字符位置范围 [start,stop) 内搜索目标字符串。如果 stop 参数为 -1,则每个字符串的末尾成为搜索包含的最终位置。
任何空字符串条目返回相应的空输出列条目。
cudf::logic_error | 如果 start 位置大于 stop 位置。 |
input | 用于此操作的字符串实例 |
target | 要在每个字符串中搜索的 UTF-8 编码字符串 |
start | 搜索包含的第一个位置 |
stop | 搜索包含的最后一个位置(不包含)。默认值 -1 将从字符串的末尾开始搜索。 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::starts_with | ( | strings_column_view const & | input, |
string_scalar const & | target, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标字符串开头,则为 true。
如果在字符串开头未找到 target
,则输出列中的该行条目设置为 false。如果 target
是一个空字符串,则输出列中的所有非空条目返回 true。
任何空字符串条目在输出列中返回相应的空条目。
input | 用于此操作的字符串实例 |
target | 要在每个字符串中搜索的 UTF-8 编码字符串 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::starts_with | ( | strings_column_view const & | input, |
strings_column_view const & | targets, | ||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标列中的对应字符串开头,则为 true。
如果在 strings[i]
的字符串开头未找到 targets[i]
,则输出列中的该行条目设置为 false。如果 targets[i]
是一个空字符串,则输出列中的相应条目返回 true。
targets
中的任何空字符串条目在输出列中返回相应的空条目。
cudf::logic_error | 如果 strings.size() != targets.size() 。 |
input | 用于此操作的字符串实例 |
targets | 用于此操作的字符串实例 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |