模块 | 文件 | 函数
字符串

模块

 大小写
 
 字符类型
 
 组合
 
 搜索
 
 转换
 
 复制
 
 切片
 
 查找
 
 修改
 
 替换
 
 分割
 
 提取
 
 正则表达式
 

文件

文件  attributes.hpp
 读取字符串列的属性。
 

函数

std::unique_ptr< cudf::strings::count_characters (strings_column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个包含给定列中每个字符串字符长度的列。 更多...
 
std::unique_ptr< cudf::strings::count_bytes (strings_column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个包含给定列中每个字符串字节长度的列。 更多...
 
std::unique_ptr< cudf::strings::code_points (strings_column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 为每个字符串的每个字符创建一个包含码点值(整数)的数值列。 更多...
 

详细说明

函数文档

◆ code_points()

std::unique_ptr<> cudf::strings::code_points ( strings_column_view const &  input,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

为每个字符串的每个字符创建一个包含码点值(整数)的数值列。

码点是字符的整数值表示。例如,UTF-8 中字符 'A' 的码点值是 65。

输出列的大小将是字符串列中的字符总数。

任何空字符串都将被忽略。输出列中不会出现空条目。

参数
input用于此操作的字符串实例
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
新的 INT32 列,包含每个字符的码点整数值

◆ count_bytes()

std::unique_ptr<> cudf::strings::count_bytes ( strings_column_view const &  input,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个包含给定列中每个字符串字节长度的列。

输出列将具有与指定字符串列相同的行数。每行的值将是对应字符串中的字节数。

任何空字符串都将导致输出列中该行出现空条目。

参数
input用于此操作的字符串实例
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
包含每个字符串字节数的新列

◆ count_characters()

std::unique_ptr<> cudf::strings::count_characters ( strings_column_view const &  input,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

返回一个包含给定列中每个字符串字符长度的列。

输出列将具有与指定字符串列相同的行数。每行的值将是对应字符串中的字符数。

任何空字符串都将导致输出列中该行出现空条目。

参数
input用于此操作的字符串实例
stream用于设备内存操作和内核启动的 CUDA 流
mr用于分配返回列的设备内存的设备内存资源
返回值
包含每个字符串长度的新列