文件 | 函数
查找

文件

文件  find.hpp
 
文件  find_multiple.hpp
 

函数

std::unique_ptr< columncudf::strings::find (strings_column_view const &input, string_scalar const &target, size_type start=0, size_type stop=-1, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个字符位置值的列,其中目标字符串首先在提供的列的每个字符串中找到。 更多...
 
std::unique_ptr< columncudf::strings::rfind (strings_column_view const &input, string_scalar const &target, size_type start=0, size_type stop=-1, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个字符位置值的列,其中目标字符串首先从每个字符串的末尾开始查找。 更多...
 
std::unique_ptr< columncudf::strings::find (strings_column_view const &input, strings_column_view const &target, size_type start=0, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个字符位置值的列,其中目标字符串首先在提供的列的对应字符串中找到。 更多...
 
std::unique_ptr< columncudf::strings::contains (strings_column_view const &input, string_scalar const &target, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串包含目标字符串,则为 true。 更多...
 
std::unique_ptr< columncudf::strings::contains (strings_column_view const &input, strings_column_view const &targets, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串包含对应的目标字符串,则为 true。 更多...
 
std::unique_ptr< columncudf::strings::starts_with (strings_column_view const &input, string_scalar const &target, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标字符串开头,则为 true。 更多...
 
std::unique_ptr< columncudf::strings::starts_with (strings_column_view const &input, strings_column_view const &targets, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标列中的对应字符串开头,则为 true。 更多...
 
std::unique_ptr< columncudf::strings::ends_with (strings_column_view const &input, string_scalar const &target, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标字符串结尾,则为 true。 更多...
 
std::unique_ptr< columncudf::strings::ends_with (strings_column_view const &input, strings_column_view const &targets, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标列中的对应字符串结尾,则为 true。 更多...
 
std::unique_ptr< tablecudf::strings::contains_multiple (strings_column_view const &input, strings_column_view const &targets, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::mr::device_memory_resource *mr=rmm::mr::get_current_device_resource())
 在提供的列的每个字符串中搜索给定的目标字符串。 更多...
 
std::unique_ptr< columncudf::strings::find_multiple (strings_column_view const &input, strings_column_view const &targets, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在提供的列的每个字符串中搜索给定的目标字符串,并返回找到目标字符串的位置。 更多...
 

详细描述

函数文档

◆ contains() [1/2]

std::unique_ptr<column> cudf::strings::contains ( strings_column_view const &  input,
string_scalar const &  target,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串包含目标字符串,则为 true。

如果在字符串中未找到 target,则输出列中的对应条目返回 false。如果 target 是一个空字符串,则输出列中的所有非空条目返回 true。

任何空字符串条目在输出列中返回相应的空条目。

参数
input用于此操作的字符串实例
target要在每个字符串中搜索的 UTF-8 编码字符串
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的 BOOL8 列

◆ contains() [2/2]

std::unique_ptr<column> cudf::strings::contains ( strings_column_view const &  input,
strings_column_view const &  targets,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串包含对应的目标字符串,则为 true。

如果字符串 targets[i]input[i] 内找到,则 output[i] = true,否则 output[i] = false。如果 target[i] 是一个空字符串,则 output[i] 返回 true。如果 target[i] 为 null,则 output[i] 返回 false。

任何空字符串条目在输出列中返回相应的空条目。

异常
cudf::logic_error如果 strings.size() != targets.size()
参数
input用于此操作的字符串实例
targetsstrings 中按行检查的目标字符串列
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的 BOOL8 列

◆ contains_multiple()

std::unique_ptr<table> cudf::strings::contains_multiple ( strings_column_view const &  input,
strings_column_view const &  targets,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::mr::device_memory_resource mr = rmm::mr::get_current_device_resource() 
)

在提供的列的每个字符串中搜索给定的目标字符串。

结果表中的每一列对应于相同序号的目标字符串的结果。即,第 0 列是第 0 个目标字符串的 BOOL8 列结果,第 1 列是第 1 个目标字符串的结果,以此类推。

如果在字符串中未找到目标,则输出列中的对应条目返回 false。如果目标是一个空字符串,则输出列中的所有非空条目返回 true。

任何空输入字符串在输出列中返回相应的空条目。

input = ["a", "b", "c"]
targets = ["a", "c"]
输出是一个包含两个布尔值列的表
列 0: [true, false, false]
列 1: [false, false, true]
异常
std::invalid_argument如果 targets 为空或包含 null
参数
input用于此操作的字符串实例
targetsinput 的每个字符串中搜索的 UTF-8 编码字符串
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
BOOL8 列组成的表

◆ ends_with() [1/2]

std::unique_ptr<column> cudf::strings::ends_with ( strings_column_view const &  input,
string_scalar const &  target,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标字符串结尾,则为 true。

如果在字符串末尾未找到 target,则输出列中的该行条目设置为 false。如果 target 是一个空字符串,则输出列中的所有非空条目返回 true。

任何空字符串条目在输出列中返回相应的空条目。

参数
input用于此操作的字符串实例
target要在每个字符串中搜索的 UTF-8 编码字符串
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的 BOOL8 列

◆ ends_with() [2/2]

std::unique_ptr<column> cudf::strings::ends_with ( strings_column_view const &  input,
strings_column_view const &  targets,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标列中的对应字符串结尾,则为 true。

如果在 strings[i] 的字符串末尾未找到 targets[i],则输出列中的该行条目设置为 false。如果 targets[i] 是一个空字符串,则输出列中的相应条目返回 true。

targets 中的任何空字符串条目在输出列中返回相应的空条目。

异常
cudf::logic_error如果 strings.size() != targets.size()
参数
input用于此操作的字符串实例
targets用于此操作的字符串实例
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的 BOOL8 列

◆ find() [1/2]

std::unique_ptr<column> cudf::strings::find ( strings_column_view const &  input,
string_scalar const &  target,
size_type  start = 0,
size_type  stop = -1,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个字符位置值的列,其中目标字符串首先在提供的列的每个字符串中找到。

如果未找到 target,则输出列中的该行条目返回 -1。

在每个字符串的字符位置范围 [start,stop) 内搜索目标字符串。如果 stop 参数为 -1,则每个字符串的末尾成为搜索包含的最终位置。

任何空字符串条目返回相应的空输出列条目。

异常
cudf::logic_error如果 start 位置大于 stop 位置。
参数
input用于此操作的字符串实例
target要在每个字符串中搜索的 UTF-8 编码字符串
start搜索包含的第一个字符位置
stop搜索包含的最后一个位置(不包含)。默认值 -1 将搜索到字符串的末尾。
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的包含字符位置值的整型列

◆ find() [2/2]

std::unique_ptr<column> cudf::strings::find ( strings_column_view const &  input,
strings_column_view const &  target,
size_type  start = 0,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个字符位置值的列,其中目标字符串首先在提供的列的对应字符串中找到。

i 的输出是行 i 的目标字符串在输入字符串行 i 中从字符位置 start 开始的位置。如果在输入字符串中未找到目标,则输出列中的该行条目返回 -1。

任何空输入或目标条目返回相应的空输出列条目。

异常
cudf::logic_error如果 input.size() != target.size()
参数
input要搜索的字符串
targetinput 中搜索的字符串
start搜索包含的第一个字符位置
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的包含字符位置值的整型列

◆ find_multiple()

std::unique_ptr<column> cudf::strings::find_multiple ( strings_column_view const &  input,
strings_column_view const &  targets,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

在提供的列的每个字符串中搜索给定的目标字符串,并返回找到目标字符串的位置。

输出列的大小是 input.size()。输出列的每一行的大小是 targets.size()

output[i,j] 包含 targets[j]input[i] 中的位置

示例
s = ["abc", "def"]
t = ["a", "c", "e"]
r = find_multiple(s, t)
r is now {[ 0, 2,-1], // 对于 "abc": "a" 在位置 0, "c" 在位置 2, 未找到 "e"
[-1,-1, 1 ]} // 对于 "def": 未找到 "a" 和 "b", "e" 在位置 1
异常
std::invalid_argument如果 targets 为空或包含 null
参数
input用于此操作的字符串实例
targets在每个字符串中搜索的字符串
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
包含字符位置值的列表列

◆ rfind()

std::unique_ptr<column> cudf::strings::rfind ( strings_column_view const &  input,
string_scalar const &  target,
size_type  start = 0,
size_type  stop = -1,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个字符位置值的列,其中目标字符串首先从每个字符串的末尾开始查找。

如果未找到 target,则该条目返回 -1。

在每个字符串的字符位置范围 [start,stop) 内搜索目标字符串。如果 stop 参数为 -1,则每个字符串的末尾成为搜索包含的最终位置。

任何空字符串条目返回相应的空输出列条目。

异常
cudf::logic_error如果 start 位置大于 stop 位置。
参数
input用于此操作的字符串实例
target要在每个字符串中搜索的 UTF-8 编码字符串
start搜索包含的第一个位置
stop搜索包含的最后一个位置(不包含)。默认值 -1 将从字符串的末尾开始搜索。
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的包含字符位置值的整型列

◆ starts_with() [1/2]

std::unique_ptr<column> cudf::strings::starts_with ( strings_column_view const &  input,
string_scalar const &  target,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标字符串开头,则为 true。

如果在字符串开头未找到 target,则输出列中的该行条目设置为 false。如果 target 是一个空字符串,则输出列中的所有非空条目返回 true。

任何空字符串条目在输出列中返回相应的空条目。

参数
input用于此操作的字符串实例
target要在每个字符串中搜索的 UTF-8 编码字符串
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的 type_id::BOOL8 列。

◆ starts_with() [2/2]

std::unique_ptr<column> cudf::strings::starts_with ( strings_column_view const &  input,
strings_column_view const &  targets,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个布尔值列,对于每个字符串,如果提供的列中的该字符串以目标列中的对应字符串开头,则为 true。

如果在 strings[i] 的字符串开头未找到 targets[i],则输出列中的该行条目设置为 false。如果 targets[i] 是一个空字符串,则输出列中的相应条目返回 true。

targets 中的任何空字符串条目在输出列中返回相应的空条目。

异常
cudf::logic_error如果 strings.size() != targets.size()
参数
input用于此操作的字符串实例
targets用于此操作的字符串实例
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的 BOOL8 列