文件 | |
文件 | capitalize.hpp |
文件 | case.hpp |
std::unique_ptr<column> cudf::strings::capitalize | ( | strings_column_view const & | input, |
string_scalar const & | delimiters = string_scalar("", true, cudf::get_default_stream()) , |
||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个首字母大写的字符串列。
如果 delimiters
是空字符串,则只将每行的第一个字符大写。否则,在找到任何分隔符字符后,会将非分隔符字符大写。
任何空字符串条目会返回相应的空输出列条目。
cudf::logic_error | 如果 delimiter.is_valid() 为 false 。 |
input | 字符串列 |
delimiters | 用于识别要大写单词的字符 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::is_title | ( | strings_column_view const & | input, |
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
检查输入列中的字符串是否为标题格式。
每个单词的第一个字符应为大写,而所有其他字符应为小写。单词是一系列大写和小写字符。
此函数返回一个布尔值列,如果输入行中的字符串为标题格式,则为 true,否则为 false。
任何空字符串条目会导致相应的输出列条目为空。
input | 字符串列 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::swapcase | ( | strings_column_view const & | strings, |
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个将小写字符转换为大写,大写字符转换为小写的字符串列。
只转换大写或小写字母字符。所有其他字符都被复制。大小写转换可能导致字符串的字节长度比原始字符串长或短。
任何空条目会在输出列中创建空条目。
strings | 用于此操作的 Strings 实例。 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源。 |
std::unique_ptr<column> cudf::strings::title | ( | strings_column_view const & | input, |
string_character_types | sequence_type = string_character_types::ALPHA , |
||
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
修改每个单词的首字母为大写,其余字母为小写。
这里的单词是由 sequence_type
字符序列组成,并由不属于 sequence_type
字符集的任何字符分隔。
此函数返回一个字符串列,其中对于输入中的每个字符串行,每个单词的第一个字符被转换为大写,而单词中所有剩余的字符都被转换为小写。
任何空字符串条目会返回相应的空输出列条目。
input | 字符串列 |
sequence_type | 用于识别单词的字符类型 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<column> cudf::strings::to_lower | ( | strings_column_view const & | strings, |
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
将字符串列转换为小写。
只转换大写字母字符。所有其他字符都被复制。大小写转换可能导致字符串的字节长度比原始字符串长或短。
任何空条目会在输出列中创建空条目。
strings | 用于此操作的 Strings 实例。 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源。 |
std::unique_ptr<column> cudf::strings::to_upper | ( | strings_column_view const & | strings, |
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
将字符串列转换为大写。
只转换小写字母字符。所有其他字符都被复制。大小写转换可能导致字符串的字节长度比原始字符串长或短。
任何空条目会在输出列中创建空条目。
strings | 用于此操作的 Strings 实例。 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源。 |