data_sink.hpp
前往此文件的文档。
1 /*
2  * Copyright (c) 2020-2025, NVIDIA CORPORATION.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * https://apache.ac.cn/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16 
17 #pragma once
18 
19 #include <cudf/types.hpp>
20 #include <cudf/utilities/error.hpp>
21 
22 #include <rmm/cuda_stream_view.hpp>
23 
24 #include <algorithm>
25 #include <future>
26 #include <memory>
27 #include <string>
28 #include <vector>
29 
30 namespace CUDF_EXPORT cudf {
32 namespace io {
33 
43 class data_sink {
44  public
51  static std::unique_ptr<data_sink> create(std::string const& filepath);
52 
59  static std::unique_ptr<data_sink> create(std::vector<char>* buffer);
60 
69  static std::unique_ptr<data_sink> create();
70 
82  static std::unique_ptr<data_sink> create(cudf::io::data_sink* const user_sink);
83 
90  template <typename T>
91  static std::vector<std::unique_ptr<data_sink>> create(std::vector<T> const& args)
92  {
93  std::vector<std::unique_ptr<data_sink>> sinks;
94  sinks.reserve(args.size());
95  std::transform(args.cbegin(), args.cend(), std::back_inserter(sinks), [](auto const& arg) {
96  return data_sink::create(arg);
97  });
98  return sinks;
99  }
100 
104  virtual ~data_sink(){};
105 
112  virtual void host_write(void const* data, size_t size) = 0;
113 
136  [[nodiscard]] virtual bool supports_device_write() const { return false; }
137 
144  [[nodiscard]] virtual bool is_device_write_preferred(size_t size) const
145  {
146  return supports_device_write();
147  }
148 
163  virtual void device_write(void const* gpu_data, size_t size, rmm::cuda_stream_view stream)
164  {
165  CUDF_FAIL("data_sink classes that support device_write must override it.");
166  }
167 
190  virtual std::future<void> device_write_async(void const* gpu_data,
191  size_t size,
192  rmm::cuda_stream_view stream)
193  {
194  CUDF_FAIL("data_sink classes that support device_write_async must override it.");
195  }
196 
200  virtual void flush() = 0;
201 
207  virtual size_t bytes_written() = 0;
208 };
209  // end of group
211 } // namespace io
212 } // namespace CUDF_EXPORT cudf
用于存储写入器输出数据的接口类。
virtual void flush()=0
刷新写入到数据槽中的数据。
static std::vector< std::unique_ptr< data_sink > > create(std::vector< T > const &args)
创建数据槽向量,输入向量中的每个元素对应一个数据槽。
virtual void device_write(void const *gpu_data, size_t size, rmm::cuda_stream_view stream)
将缓冲区内容从 GPU 地址追加到数据槽。
virtual bool supports_device_write() const
此数据槽是否支持从 GPU 内存地址写入。
static std::unique_ptr< data_sink > create(cudf::io::data_sink *const user_sink)
创建一个包装的自定义用户数据槽。
virtual bool is_device_write_preferred(size_t size) const
估算对于给定大小的数据,直接从设备写入是否更优。
static std::unique_ptr< data_sink > create()
创建一个空数据槽(不执行实际 I/O 的数据槽)
static std::unique_ptr< data_sink > create(std::string const &filepath)
从文件路径创建一个数据槽。
virtual ~data_sink()
基类析构函数。
virtual size_t bytes_written()=0
返回写入此数据槽的总字节数。
virtual void host_write(void const *data, size_t size)=0
将缓冲区内容追加到数据槽。
virtual std::future< void > device_write_async(void const *gpu_data, size_t size, rmm::cuda_stream_view stream)
从 GPU 地址异步将缓冲区内容追加到数据槽。
static std::unique_ptr< data_sink > create(std::vector< char > *buffer)
从 std::vector 创建一个数据槽。
std::unique_ptr< column > transform(std::vector< column_view > const &inputs, std::string const &transform_udf, data_type output_type, bool is_ptx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
通过对输入列的每个元素应用转换函数来创建新列。
#define CUDF_FAIL(...)
指示代码已进入错误路径。
定义: error.hpp:217
cuDF 接口
定义: host_udf.hpp:37
libcudf 的类型声明。