文件 | 函数
大小写

文件

文件  capitalize.hpp
 
文件  case.hpp
 

函数

std::unique_ptr< cudf::strings::capitalize (strings_column_view const &input, string_scalar const &delimiters=string_scalar("", true, cudf::get_default_stream()), rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个首字母大写的字符串列。 更多...
 
std::unique_ptr< cudf::strings::title (strings_column_view const &input, string_character_types sequence_type=string_character_types::ALPHA, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 修改每个单词的首字母为大写,其余字母为小写。 更多...
 
std::unique_ptr< cudf::strings::is_title (strings_column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 检查输入列中的字符串是否为标题格式。 更多...
 
std::unique_ptr< cudf::strings::to_lower (strings_column_view const &strings, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将字符串列转换为小写。 更多...
 
std::unique_ptr< cudf::strings::to_upper (strings_column_view const &strings, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将字符串列转换为大写。 更多...
 
std::unique_ptr< cudf::strings::swapcase (strings_column_view const &strings, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个将小写字符转换为大写,大写字符转换为小写的字符串列。 更多...
 

详细描述

函数文档

◆ capitalize()

std::unique_ptr<column> cudf::strings::capitalize ( strings_column_view const &  input,
string_scalar const &  delimiters = string_scalar("", true, cudf::get_default_stream()),
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个首字母大写的字符串列。

如果 delimiters 是空字符串,则只将每行的第一个字符大写。否则,在找到任何分隔符字符后,会将非分隔符字符大写。

示例
input = ["tesT1", "a Test", "Another Test", "a\tb"];
output = capitalize(input)
output is ["Test1", "A test", "Another test", "A\tb"]
output = capitalize(input, " ")
output is ["Test1", "A Test", "Another Test", "A\tb"]
output = capitalize(input, " \t")
output is ["Test1", "A Test", "Another Test", "A\tB"]

任何空字符串条目会返回相应的空输出列条目。

异常
cudf::logic_error如果 delimiter.is_valid()false
参数
input字符串列
delimiters用于识别要大写单词的字符
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
根据输入列首字母大写的字符串列

◆ is_title()

std::unique_ptr<column> cudf::strings::is_title ( strings_column_view const &  input,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

检查输入列中的字符串是否为标题格式。

每个单词的第一个字符应为大写,而所有其他字符应为小写。单词是一系列大写和小写字符。

此函数返回一个布尔值列,如果输入行中的字符串为标题格式,则为 true,否则为 false。

示例
input = [" Test1", "A Test", " Another test ", "N2Vidia Corp", "!Abc"];
output = is_title(input)
output is [true, true, false, true, true]

任何空字符串条目会导致相应的输出列条目为空。

参数
input字符串列
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
类型为 BOOL8 的列

◆ swapcase()

std::unique_ptr<column> cudf::strings::swapcase ( strings_column_view const &  strings,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个将小写字符转换为大写,大写字符转换为小写的字符串列。

只转换大写或小写字母字符。所有其他字符都被复制。大小写转换可能导致字符串的字节长度比原始字符串长或短。

任何空条目会在输出列中创建空条目。

参数
strings用于此操作的 Strings 实例。
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源。
返回值
字符转换后的新字符串列。

◆ title()

std::unique_ptr<column> cudf::strings::title ( strings_column_view const &  input,
string_character_types  sequence_type = string_character_types::ALPHA,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

修改每个单词的首字母为大写,其余字母为小写。

这里的单词是由 sequence_type 字符序列组成,并由不属于 sequence_type 字符集的任何字符分隔。

此函数返回一个字符串列,其中对于输入中的每个字符串行,每个单词的第一个字符被转换为大写,而单词中所有剩余的字符都被转换为小写。

示例
input = [" teST1", "a Test", " Another test ", "n2vidia"];
output = title(input)
output is [" Test1", "A Test", " Another Test ", "N2Vidia"]
output = title(input,ALPHANUM)
output is [" Test1", "A Test", " Another Test ", "N2vidia"]

任何空字符串条目会返回相应的空输出列条目。

参数
input字符串列
sequence_type用于识别单词的字符类型
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
标题格式的字符串列

◆ to_lower()

std::unique_ptr<column> cudf::strings::to_lower ( strings_column_view const &  strings,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

将字符串列转换为小写。

只转换大写字母字符。所有其他字符都被复制。大小写转换可能导致字符串的字节长度比原始字符串长或短。

任何空条目会在输出列中创建空条目。

参数
strings用于此操作的 Strings 实例。
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源。
返回值
字符转换后的新字符串列。

◆ to_upper()

std::unique_ptr<column> cudf::strings::to_upper ( strings_column_view const &  strings,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

将字符串列转换为大写。

只转换小写字母字符。所有其他字符都被复制。大小写转换可能导致字符串的字节长度比原始字符串长或短。

任何空条目会在输出列中创建空条目。

参数
strings用于此操作的 Strings 实例。
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源。
返回值
字符转换后的新字符串列。