模块 | 文件 | 枚举 | 函数
重塑

模块

 转置
 

文件

文件  explode.hpp
 用于展开列表列的列API。
 
文件  reshape.hpp
 用于交错和铺平的列API。
 

枚举

枚举类  cudf::flip_endianness : bool { NO , YES }
 配置字节转换是否翻转字节序。
 

函数

std::unique_ptr< tablecudf::explode (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素。 更多...
 
std::unique_ptr< tablecudf::explode_position (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素并包含位置列。 更多...
 
std::unique_ptr< tablecudf::explode_outer (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素,保留其中的空值或空列表。 更多...
 
std::unique_ptr< tablecudf::explode_outer_position (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素,保留其中的空值或空列表,并包含位置列。 更多...
 
std::unique_ptr< columncudf::interleave_columns (table_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将表的列交错成一个单独的列。 更多...
 
std::unique_ptr< tablecudf::tile (table_view const &input, size_type count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将输入表中的行重复 count 次以形成一个新表。 更多...
 
std::unique_ptr< columncudf::byte_cast (column_view const &input_column, flip_endianness endian_configuration, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列的元素转换为字节列表。 更多...
 

详细描述

函数文档

◆ byte_cast()

std::unique_ptr<column> cudf::byte_cast ( column_view const &  input_column,
flip_endianness  endian_configuration,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

将列的元素转换为字节列表。

input<int32> = [8675, 309]
configuration = flip_endianness::YES
return = [[0x00, 0x00, 0x21, 0xe3], [0x00, 0x00, 0x01, 0x35]]
参数
input_column要转换为字节列表的列
endian_configuration是否保留或翻转元素的字节序
stream用于设备内存操作和内核启动的CUDA流
mr用于分配返回列的设备内存的设备内存资源
返回值
包含字节列表的列

◆ explode()

std::unique_ptr<table> cudf::explode ( table_view const &  input_table,
size_type  explode_column_idx,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

展开列表列的元素。

任何列表都会被展开,这意味着每行中列表的元素会被扩展到输出中的新行。输入中其他列的相应行会被复制。示例

[[5,10,15], 100],
[[20,25], 200],
[[30], 300],
返回
[5, 100],
[10, 100],
[15, 100],
[20, 200],
[25, 200],
[30, 300],

空值和空列表的传播方式取决于哪个是空值或空列表。

[[5,null,15], 100],
[null, 200],
[[], 300],
返回
[5, 100],
[null, 100],
[15, 100],

请注意,结果表中不包含空列表,但列表内的空值和空列表将以该列在该行中的空条目表示。

参数
input_table要展开的表。
explode_column_idx表内要展开的列索引。
stream用于设备内存操作和内核启动的CUDA流。
mr用于分配返回列的设备内存的设备内存资源。
返回值
包含展开列的新表。

◆ explode_outer()

std::unique_ptr<table> cudf::explode_outer ( table_view const &  input_table,
size_type  explode_column_idx,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

展开列表列的元素,保留其中的空值或空列表。

任何列表都会被展开,这意味着每行中列表的元素会被扩展到输出中的新行。输入中其他列的相应行会被复制。示例

[[5,10,15], 100],
[[20,25], 200],
[[30], 300],
返回
[5, 100],
[10, 100],
[15, 100],
[20, 200],
[25, 200],
[30, 300],

空值和空列表在结果中作为空条目传播。

[[5,null,15], 100],
[null, 200],
[[], 300],
返回
[5, 100],
[null, 100],
[15, 100],
[null, 200],
[null, 300],
参数
input_table要展开的表。
explode_column_idx表内要展开的列索引。
stream用于设备内存操作和内核启动的CUDA流。
mr用于分配返回列的设备内存的设备内存资源。
返回值
包含展开列的新表。

◆ explode_outer_position()

std::unique_ptr<table> cudf::explode_outer_position ( table_view const &  input_table,
size_type  explode_column_idx,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

展开列表列的元素,保留其中的空值或空列表,并包含位置列。

任何列表都会被展开,这意味着每行中列表的元素会被扩展到输出中的新行。输入中其他列的相应行会被复制。会添加一个位置列,该列包含每行在原始列表中的索引。示例

[[5,10,15], 100],
[[20,25], 200],
[[30], 300],
返回
[0, 5, 100],
[1, 10, 100],
[2, 15, 100],
[0, 20, 200],
[1, 25, 200],
[0, 30, 300],

空值和空列表在结果中作为空条目传播。

[[5,null,15], 100],
[null, 200],
[[], 300],
返回
[0, 5, 100],
[1, null, 100],
[2, 15, 100],
[0, null, 200],
[0, null, 300],
参数
input_table要展开的表。
explode_column_idx表内要展开的列索引。
stream用于设备内存操作和内核启动的CUDA流。
mr用于分配返回列的设备内存的设备内存资源。
返回值
包含展开列的新表。

◆ explode_position()

std::unique_ptr<table> cudf::explode_position ( table_view const &  input_table,
size_type  explode_column_idx,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

展开列表列的元素并包含位置列。

任何列表都会被展开,这意味着每行中列表的元素会被扩展到输出中的新行。输入中其他列的相应行会被复制。会添加一个位置列,该列包含每行在原始列表中的索引。示例

[[5,10,15], 100],
[[20,25], 200],
[[30], 300],
返回
[0, 5, 100],
[1, 10, 100],
[2, 15, 100],
[0, 20, 200],
[1, 25, 200],
[0, 30, 300],

空值和空列表的传播方式取决于哪个是空值或空列表。

[[5,null,15], 100],
[null, 200],
[[], 300],
返回
[0, 5, 100],
[1, null, 100],
[2, 15, 100],

请注意,结果表中不包含空列表,但列表内的空值和空列表将以该列在该行中的空条目表示。

参数
input_table要展开的表。
explode_column_idx表内要展开的列索引。
stream用于设备内存操作和内核启动的CUDA流。
mr用于分配返回列的设备内存的设备内存资源。
返回值
包含展开值和位置的新表。返回表的列顺序为 [展开输入前的列, 展开位置, 展开值, 展开输入后的列]。

◆ interleave_columns()

std::unique_ptr<column> cudf::interleave_columns ( table_view const &  input,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

将表的列交错成一个单独的列。

将列主序表 input 转换为行主序列。示例

in = [[A1, A2, A3], [B1, B2, B3]]
return = [A1, B1, A2, B2, A3, B3]
异常
cudf::logic_error如果输入不包含任何列。
cudf::logic_error如果输入列的数据类型不一致。
参数
input包含要交错的列的表
stream用于设备内存操作和内核启动的CUDA流
mr用于分配返回列的设备内存的设备内存资源
返回值
作为单独列的交错列

◆ tile()

std::unique_ptr<table> cudf::tile ( table_view const &  input,
size_type  count,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

将输入表中的行重复 count 次以形成一个新表。

output.num_columns() == input.num_columns() output.num_rows() == input.num_rows() * count

input = [[8, 4, 7], [5, 2, 3]]
count = 2
返回值 = [[8, 4, 7, 8, 4, 7], [5, 2, 3, 5, 2, 3]]
参数
input包含要重复的行的表
count重复“行”的次数。必须是非负数
stream用于设备内存操作和内核启动的CUDA流
mr用于分配返回表的设备内存的设备内存资源
返回值
包含铺平的“行”的表