contiguous_split#

class pylibcudf.contiguous_split.PackedColumns#

序列化格式的列数据。

包含来自列数组的数据,存储在两个连续的缓冲区中:一个位于主机,包含表元数据;一个位于设备,包含表数据。

详情请参阅 cudf::packed_columns

方法

release(self)

释放并返回底层序列化的元数据和 GPU 数据。

release(self) tuple#

释放并返回底层序列化的元数据和 GPU 数据。

内存的所有权将转移到返回的缓冲区。调用此方法后,self 将为空。

返回值:
memoryview (HostBuffer 类型)

作为连续主机内存的序列化元数据。

gpumemoryview (rmm.DeviceBuffer 类型)

作为连续设备内存的序列化 GPU 数据。

pylibcudf.contiguous_split.pack(Table input) PackedColumns#

将一个表深度复制到序列化的连续内存格式。

稍后使用 unpackunpack_from_memoryviews 将序列化数据解包回表中。

参数:
inputTable

要打包的表。

返回值:
PackedColumns

打包后的列。

示例

>>> packed = pylibcudf.contiguous_split.pack(...)
>>> # Either unpack the whole `PackedColumns` at once.
>>> pylibcudf.contiguous_split.unpack(packed)
>>> # Or unpack the two serialized buffers in `PackedColumns`.
>>> metadata, gpu_data = packed.release()
>>> pylibcudf.contiguous_split.unpack_from_memoryviews(metadata, gpu_data)

详情请参阅 cudf::pack()

pylibcudf.contiguous_split.unpack(PackedColumns input) Table#

反序列化 pack 的结果。

将序列化表的结果复制到一个表中。与 libcudf C++ 函数不同,返回的表是序列化数据的副本。

详情请参阅 cudf::unpack()

参数:
inputPackedColumns

要解包的打包列。

返回值:
Table

打包列的副本。

pylibcudf.contiguous_split.unpack_from_memoryviews(memoryview metadata, gpumemoryview gpu_data) Table#

反序列化 pack 的结果。

将序列化表的结果复制到一个表中。与 libcudf C++ 函数不同,返回的表是序列化数据的副本。

详情请参阅 cudf::unpack()

参数:
metadatamemoryview

要解包的打包元数据。

gpu_datagpumemoryview

要解包的打包 gpu_data。

返回值:
Table

打包列的副本。