libcudf：null_mask.hpp 源文件

 /*

  * Copyright (c) 2019-2024, NVIDIA CORPORATION.

  *

  * 根据 Apache 许可证 2.0 版本 (“许可证”) 获得许可；

  * 除非遵守许可证，否则不得使用此文件。

  * 您可以获取许可证的副本：

  *

  * https://apache.ac.cn/licenses/LICENSE-2.0

  *

  * 除非适用法律要求或书面同意，否则根据许可证分发的软件是

  * 在“按原样”的基础上分发的，

  * 不附带任何明示或暗示的担保或条件。

  * 请参阅许可证以了解管理权限和

  * 限制的特定语言。

  */

 #pragma once


 #include <cudf/types.hpp>

 #include <cudf/utilities/default_stream.hpp>

 #include <cudf/utilities/export.hpp>

 #include <cudf/utilities/memory_resource.hpp>

 #include <cudf/utilities/span.hpp>


 #include <rmm/device_buffer.hpp>


 #include <vector>


 namespace CUDF_EXPORT cudf {


 /**

  * @brief 返回表示 size 元素的指定状态的 null 掩码的 null 计数。

  *

  * @param state null 掩码的状态。

  * @param size 列中的元素数量。

  * @return null 掩码的 null 计数。

  */

 size_type state_null_count(mask_state state, size_type size);


 /**

  * @brief 计算表示指定位数以及给定填充边界所需的字节数。

  *

  * @param number_of_bits 要表示的位数。

  * @param padding_boundary 返回大小必须对齐的字节数。

  * @return 位掩码所需的字节数，向上取整到下一个`padding_boundary`的倍数。

  */

 std::size_t bitmask_allocation_size_bytes(size_type number_of_bits,

  std::size_t padding_boundary = 64);


 /**

  * @brief 返回表示指定位数所需的 bitmask_type 单词数。

  *

  * @param number_of_bits 要表示的位数。

  * @return 位掩码所需的`bitmask_type`单词数。

  */

 size_type num_bitmask_words(size_type number_of_bits);


 /**

  * @brief 创建一个 device_buffer，用于作为列的空值指示符位掩码。

  *

  * @param size 列中的元素数量。

  * @param state null 掩码的状态。

  * @param stream 用于分配的 CUDA 流。

  * @param mr 用于分配的设备内存资源

  * @return 一个 device_buffer，包含 size_type::state_null_count(state, size) 个 null 值。

  */

 rmm::device_buffer create_null_mask(

  size_type size,

  mask_state state,

  rmm::cuda_stream_view stream = cudf::get_default_stream(),

  rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref());


 /**

  * @brief 将预分配的位掩码缓冲区在范围 [begin_bit, end_bit) 内设置为给定状态

  *

  * @param bitmask 指向位掩码开头的指针

  * @param begin_bit 起始位索引（包含）
  * @param end_bit 结束位索引（不包含）
  * @param valid 布尔值，指示是将位设置为有效 (true) 还是 null (false)

  * @param stream 用于操作的 CUDA 流
  */
 void set_null_mask(bitmask_type* bitmask,

  size_type begin_bit,

  size_type end_bit,

  bool valid,

  rmm::cuda_stream_view stream = cudf::get_default_stream());


 /**
  * @brief 将位掩码中的连续位范围复制到新的位掩码中

  *
  * @param mask 指向输入位掩码开头的指针
  * @param begin_bit 起始位索引（包含）

  * @param end_bit 结束位索引（不包含）
  * @param stream 用于操作的 CUDA 流
  * @param mr 用于分配的设备内存资源

  * @return 包含复制位的新 device_buffer
  */
 rmm::device_buffer copy_bitmask(

  bitmask_type const* mask,
  size_type begin_bit,
  size_type end_bit,

  rmm::cuda_stream_view stream = cudf::get_default_stream(),
  rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref());


 /**
  * @brief 将视图的位掩码从位 [view.offset(), view.offset() + view.size()) 复制到 device_buffer 中
  *

  * @param view 要复制掩码的 column_view
  * @param stream 用于操作的 CUDA 流
  * @param mr 用于分配的设备内存资源

  * @return 包含复制位的新 device_buffer
  */
 rmm::device_buffer copy_bitmask(

  column_view const& view,
  rmm::cuda_stream_view stream = cudf::get_default_stream(),
  rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref());


 /**
  * @brief 对表的列的位掩码执行按位 AND 运算。
  * 返回结果掩码和 null 计数的对。

  *
  * @param view 要执行 AND 运算的表（column）视图

  * @param stream 用于操作的 CUDA 流
  * @param mr 用于分配的设备内存资源
  * @return 结果掩码和 null 计数的对。
  */

 std::pair<rmm::device_buffer, size_type> bitmask_and(
  table_view const& view,
  rmm::cuda_stream_view stream = cudf::get_default_stream(),
  rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref());


 /**
  * @brief 对表的列的位掩码执行按位 OR 运算。
  * 返回结果掩码和 null 计数的对。

  *

cudf
  * @param view 要执行 OR 运算的表（column）视图
  * @param stream 用于操作的 CUDA 流

  * @param mr 用于分配的设备内存资源
  * @return 结果掩码和 null 计数的对。

  */
 std::pair<rmm::device_buffer, size_type> bitmask_or(