libcudf: contiguous_split.hpp 源文件

 /*

  * Copyright (c) 2023-2025, NVIDIA CORPORATION.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  * https://apache.ac.cn/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #pragma once


 #include <cudf/table/table.hpp>

 #include <cudf/types.hpp>

 #include <cudf/utilities/export.hpp>

 #include <cudf/utilities/memory_resource.hpp>


 #include <memory>

 #include <vector>


 namespace CUDF_EXPORT cudf {


 struct packed_columns {

  packed_columns()

  : metadata(std::make_unique<std::vector<uint8_t>>()),

  gpu_data(std::make_unique<rmm::device_buffer>())

  {

  }


  packed_columns(std::unique_ptr<std::vector<uint8_t>>&& md,

  std::unique_ptr<rmm::device_buffer>&& gd)

  : metadata(std::move(md)), gpu_data(std::move(gd))

  {

  }


  std::unique_ptr<std::vector<uint8_t>> metadata;

  std::unique_ptr<rmm::device_buffer> gpu_data;

 };


 struct packed_table {

  cudf::table_view table;

  packed_columns data;

 };


 std::vector<packed_table> contiguous_split(

  cudf::table_view const& input,

  std::vector<size_type> const& splits,

  rmm::cuda_stream_view stream = cudf::get_default_stream(),

  rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref());


 namespace detail {


 struct contiguous_split_state;

 } // namespace detail


 class chunked_pack {

  public

  explicit chunked_pack(

  cudf::table_view const& input,

  std::size_t user_buffer_size,

  rmm::cuda_stream_view stream = cudf::get_default_stream(),

  rmm::device_async_resource_ref temp_mr = cudf::get_current_device_resource_ref());


  ~chunked_pack();


  [[nodiscard]] std::size_t get_total_contiguous_size() const;


  [[nodiscard]] bool has_next() const;


  [[nodiscard]] std::size_t next(cudf::device_span<uint8_t> const& user_buffer);


  [[nodiscard]] std::unique_ptr<std::vector<uint8_t>> build_metadata() const;


  [[nodiscard]] static std::unique_ptr<chunked_pack> create(

  cudf::table_view const& input,

  std::size_t user_buffer_size,

  rmm::cuda_stream_view stream = cudf::get_default_stream(),

  rmm::device_async_resource_ref temp_mr = cudf::get_current_device_resource_ref());


  private

  // internal state of contiguous split

  std::unique_ptr<detail::contiguous_split_state> state;

 };


 packed_columns pack(cudf::table_view const& input,

  rmm::cuda_stream_view stream = cudf::get_default_stream(),

  rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref());


 std::vector<uint8_t> pack_metadata(table_view const& table,

  uint8_t const* contiguous_buffer,

  size_t buffer_size);


 table_view unpack(packed_columns const& input);


 table_view unpack(uint8_t const* metadata, uint8_t const* gpu_data);


 } // namespace CUDF_EXPORT cudf

cudf::chunked_pack
使用用户提供的 user_buffer_size 大小的缓冲区执行输入 table_view 的分块“打包”操作...
定义： contiguous_split.hpp:195

cudf::chunked_pack::get_total_contiguous_size
std::size_t get_total_contiguous_size() const
获取连续打包的 table_view 的总大小。

cudf::chunked_pack::next
std::size_t next(cudf::device_span< uint8_t > const &user_buffer)
将下一个块打包到 user_buffer 中。只要 has_next 返回 true，就应调用此函数。

cudf::chunked_pack::~chunked_pack
~chunked_pack()
将实现为默认的析构函数。此处声明并带有定义是因为 contiguous_split...

cudf::chunked_pack::chunked_pack
chunked_pack(cudf::table_view const &input, std::size_t user_buffer_size, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref temp_mr=cudf::get_current_device_resource_ref())
构造一个 chunked_pack 类。

cudf::chunked_pack::build_metadata
std::unique_ptr< std::vector< uint8_t > > build_metadata() const
构建所有已添加列的不透明元数据。

cudf::chunked_pack::create
static std::unique_ptr< chunked_pack > create(cudf::table_view const &input, std::size_t user_buffer_size, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref temp_mr=cudf::get_current_device_resource_ref())
创建一个 chunked_pack 实例，用于执行 table_view "input" 的“打包”操作，其中用户提供...

cudf::chunked_pack::has_next
bool has_next() const
检查是否有剩余块需要复制的函数。

cudf::table_view
一组大小相同的 cudf::column_view。
定义： table_view.hpp:200

cudf::table
一组大小相同的 cudf::column。
定义： table.hpp:40

rmm::cuda_stream_view

cudf::contiguous_split
std::vector< packed_table > contiguous_split(cudf::table_view const &input, std::vector< size_type > const &splits, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
对 table_view 进行深度复制分割，将其分割成 packed_table 的向量，其中每个 packed_table 都...

cudf::pack
packed_columns pack(cudf::table_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
将 table_view 深度复制到序列化的连续内存格式。

cudf::unpack
table_view unpack(uint8_t const *metadata, uint8_t const *gpu_data)
反序列化 cudf::pack 的结果。

cudf::pack_metadata
std::vector< uint8_t > pack_metadata(table_view const &table, uint8_t const *contiguous_buffer, size_t buffer_size)
生成用于打包存储在连续缓冲区中的表的元数据。

cudf::get_default_stream
rmm::cuda_stream_view const get_default_stream()
获取当前默认流。

cudf::get_current_device_resource_ref
rmm::device_async_resource_ref get_current_device_resource_ref()
获取当前设备内存资源引用。
定义： memory_resource.hpp:47

device_async_resource_ref
cuda::mr::async_resource_ref< cuda::mr::device_accessible > device_async_resource_ref

memory_resource.hpp

cudf
cuDF 接口
定义： host_udf.hpp:37

cudf::device_span
具有简化功能集的 C++20 std::span 的设备版本。
定义： span.hpp:355

cudf::packed_columns
序列化格式的列数据。
定义： contiguous_split.hpp:42

cudf::packed_columns::packed_columns
packed_columns(std::unique_ptr< std::vector< uint8_t >> &&md, std::unique_ptr< rmm::device_buffer > &&gd)
构造一个新的打包列对象。
定义： contiguous_split.hpp:55

cudf::packed_columns::metadata
std::unique_ptr< std::vector< uint8_t > > metadata
主机侧元数据缓冲区。
定义： contiguous_split.hpp:61

cudf::packed_columns::gpu_data
std::unique_ptr< rmm::device_buffer > gpu_data
设备侧数据缓冲区。
定义： contiguous_split.hpp:62

cudf::packed_table
cudf::contiguous_split 的结果。
定义： contiguous_split.hpp:77

cudf::packed_table::data
packed_columns data
拥有的列数据。
定义： contiguous_split.hpp:79

cudf::packed_table::table
cudf::table_view table
cudf::contiguous_split 的结果 table_view。
定义： contiguous_split.hpp:78

table.hpp
cudf::table 的类定义。

types.hpp
libcudf 的类型声明。