libcudf: data_sink.hpp 源文件

 /*

  * Copyright (c) 2020-2025, NVIDIA CORPORATION.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  * https://apache.ac.cn/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #pragma once


 #include <cudf/types.hpp>

 #include <cudf/utilities/error.hpp>


 #include <rmm/cuda_stream_view.hpp>


 #include <algorithm>

 #include <future>

 #include <memory>

 #include <string>

 #include <vector>


 namespace CUDF_EXPORT cudf {

 namespace io {


 class data_sink {

  public

  static std::unique_ptr<data_sink> create(std::string const& filepath);


  static std::unique_ptr<data_sink> create(std::vector<char>* buffer);


  static std::unique_ptr<data_sink> create();


  static std::unique_ptr<data_sink> create(cudf::io::data_sink* const user_sink);


  template <typename T>

  static std::vector<std::unique_ptr<data_sink>> create(std::vector<T> const& args)

  {

  std::vector<std::unique_ptr<data_sink>> sinks;

  sinks.reserve(args.size());

  std::transform(args.cbegin(), args.cend(), std::back_inserter(sinks), [](auto const& arg) {

  return data_sink::create(arg);

  });

  return sinks;

  }


  virtual ~data_sink(){};


  virtual void host_write(void const* data, size_t size) = 0;


  [[nodiscard]] virtual bool supports_device_write() const { return false; }


  [[nodiscard]] virtual bool is_device_write_preferred(size_t size) const

  {

  return supports_device_write();

  }


  virtual void device_write(void const* gpu_data, size_t size, rmm::cuda_stream_view stream)

  {

  CUDF_FAIL("data_sink classes that support device_write must override it.");

  }


  virtual std::future<void> device_write_async(void const* gpu_data,

  size_t size,

  rmm::cuda_stream_view stream)

  {

  CUDF_FAIL("data_sink classes that support device_write_async must override it.");

  }


  virtual void flush() = 0;


  virtual size_t bytes_written() = 0;

 };

  // end of group

 } // namespace io

 } // namespace CUDF_EXPORT cudf

cudf::io::data_sink
用于存储写入器输出数据的接口类。
定义： data_sink.hpp:43

cudf::io::data_sink::flush
virtual void flush()=0
刷新写入到数据槽中的数据。

cudf::io::data_sink::create
static std::vector< std::unique_ptr< data_sink > > create(std::vector< T > const &args)
创建数据槽向量，输入向量中的每个元素对应一个数据槽。
定义： data_sink.hpp:91

cudf::io::data_sink::device_write
virtual void device_write(void const *gpu_data, size_t size, rmm::cuda_stream_view stream)
将缓冲区内容从 GPU 地址追加到数据槽。
定义： data_sink.hpp:163

cudf::io::data_sink::supports_device_write
virtual bool supports_device_write() const
此数据槽是否支持从 GPU 内存地址写入。
定义： data_sink.hpp:136

cudf::io::data_sink::create
static std::unique_ptr< data_sink > create(cudf::io::data_sink *const user_sink)
创建一个包装的自定义用户数据槽。

cudf::io::data_sink::is_device_write_preferred
virtual bool is_device_write_preferred(size_t size) const
估算对于给定大小的数据，直接从设备写入是否更优。
定义： data_sink.hpp:144

cudf::io::data_sink::create
static std::unique_ptr< data_sink > create()
创建一个空数据槽（不执行实际 I/O 的数据槽）

cudf::io::data_sink::create
static std::unique_ptr< data_sink > create(std::string const &filepath)
从文件路径创建一个数据槽。

cudf::io::data_sink::~data_sink
virtual ~data_sink()
基类析构函数。
定义： data_sink.hpp:104

cudf::io::data_sink::bytes_written
virtual size_t bytes_written()=0
返回写入此数据槽的总字节数。

cudf::io::data_sink::host_write
virtual void host_write(void const *data, size_t size)=0
将缓冲区内容追加到数据槽。

cudf::io::data_sink::device_write_async
virtual std::future< void > device_write_async(void const *gpu_data, size_t size, rmm::cuda_stream_view stream)
从 GPU 地址异步将缓冲区内容追加到数据槽。
定义： data_sink.hpp:190

cudf::io::data_sink::create
static std::unique_ptr< data_sink > create(std::vector< char > *buffer)
从 std::vector 创建一个数据槽。

rmm::cuda_stream_view

cuda_stream_view.hpp

error.hpp

cudf::transform
std::unique_ptr< column > transform(std::vector< column_view > const &inputs, std::string const &transform_udf, data_type output_type, bool is_ptx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
通过对输入列的每个元素应用转换函数来创建新列。

CUDF_FAIL
#define CUDF_FAIL(...)
指示代码已进入错误路径。
定义： error.hpp:217

cudf
cuDF 接口
定义： host_udf.hpp:37

types.hpp
libcudf 的类型声明。