模块 | |
大小写 | |
字符类型 | |
组合 | |
搜索 | |
转换 | |
复制 | |
切片 | |
查找 | |
修改 | |
替换 | |
分割 | |
提取 | |
正则表达式 | |
文件 | |
文件 | attributes.hpp |
读取字符串列的属性。 | |
函数 | |
std::unique_ptr< 列 > | cudf::strings::count_characters (strings_column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref()) |
返回一个包含给定列中每个字符串字符长度的列。 更多... | |
std::unique_ptr< 列 > | cudf::strings::count_bytes (strings_column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref()) |
返回一个包含给定列中每个字符串字节长度的列。 更多... | |
std::unique_ptr< 列 > | cudf::strings::code_points (strings_column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref()) |
为每个字符串的每个字符创建一个包含码点值(整数)的数值列。 更多... | |
std::unique_ptr<列> cudf::strings::code_points | ( | strings_column_view const & | input, |
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
为每个字符串的每个字符创建一个包含码点值(整数)的数值列。
码点是字符的整数值表示。例如,UTF-8 中字符 'A' 的码点值是 65。
输出列的大小将是字符串列中的字符总数。
任何空字符串都将被忽略。输出列中不会出现空条目。
input | 用于此操作的字符串实例 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<列> cudf::strings::count_bytes | ( | strings_column_view const & | input, |
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个包含给定列中每个字符串字节长度的列。
输出列将具有与指定字符串列相同的行数。每行的值将是对应字符串中的字节数。
任何空字符串都将导致输出列中该行出现空条目。
input | 用于此操作的字符串实例 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |
std::unique_ptr<列> cudf::strings::count_characters | ( | strings_column_view const & | input, |
rmm::cuda_stream_view | stream = cudf::get_default_stream() , |
||
rmm::device_async_resource_ref | mr = cudf::get_current_device_resource_ref() |
||
) |
返回一个包含给定列中每个字符串字符长度的列。
输出列将具有与指定字符串列相同的行数。每行的值将是对应字符串中的字符数。
任何空字符串都将导致输出列中该行出现空条目。
input | 用于此操作的字符串实例 |
stream | 用于设备内存操作和内核启动的 CUDA 流 |
mr | 用于分配返回列的设备内存的设备内存资源 |