26 #include <cudf/utilities/export.hpp>
32 namespace CUDF_EXPORT
cudf {
217 std::vector<std::reference_wrapper<scalar const>>
const& source,
469 std::initializer_list<size_type> indices,
513 std::initializer_list<size_type> indices,
557 std::initializer_list<size_type> splits,
603 std::initializer_list<size_type> splits,
786 std::vector<std::reference_wrapper<scalar const>>
const& input,
852 int64_t
const seed = 0,
作为元素列的设备数据的非拥有、不可变视图,其中某些元素可能为空,如...所示
作为元素列的设备数据的非拥有、可变视图,其中某些元素可能为空,如...所示
一组大小相同的 cudf::column_view。
mask_allocation_policy
指示何时根据现有掩码分配掩码。
std::unique_ptr< column > reverse(column_view const &source_column, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
反转列的元素。
std::unique_ptr< column > copy_if_else(scalar const &lhs, scalar const &rhs, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
返回一个新列,其中每个元素根据布尔掩码的值从 lhs 或 rhs 中选择。
std::unique_ptr< column > allocate_like(column_view const &input, size_type size, mask_allocation_policy mask_alloc=mask_allocation_policy::RETAIN, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
创建一个指定大小且与输入类型相同但未初始化的新列。
bool may_have_nonempty_nulls(column_view const &input)
近似检查列或其后代是否可能包含非空的空元素。
void copy_range_in_place(column_view const &source, mutable_column_view &target, size_type source_begin, size_type source_end, size_type target_begin, rmm::cuda_stream_view stream=cudf::get_default_stream())
就地将元素范围从一列复制到另一列。
std::unique_ptr< table > sample(table_view const &input, size_type const n, sample_with_replacement replacement=sample_with_replacement::FALSE, int64_t const seed=0, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
从给定的输入中随机采集 n 个样本。
bool has_nonempty_nulls(column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream())
检查列或其后代是否包含非空的空行。
std::unique_ptr< column > purge_nonempty_nulls(column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
将输入复制到输出,同时清除列或其后代中的任何非空的空行。
std::unique_ptr< column > copy_range(column_view const &source, column_view const &target, size_type source_begin, size_type source_end, size_type target_begin, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
将元素范围从一列复制到另一列(创建新列)。
out_of_bounds_policy
用于处理可能的越界索引的策略。
sample_with_replacement
指示一行是否可以采样多次。
std::unique_ptr< scalar > get_element(column_view const &input, size_type index, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
从列中获取指定索引处的元素。
std::unique_ptr< table > empty_like(table_view const &input_table)
创建一个由与输入表类型相同的空列组成的表。
@ RETAIN
如果输入包含空值掩码,则分配一个。
@ DONT_CHECK
不执行边界检查,性能更佳。
std::unique_ptr< table > gather(table_view const &source_table, column_view const &gather_map, out_of_bounds_policy bounds_policy=out_of_bounds_policy::DONT_CHECK, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
采集指定行(包括空值)的一组列。
std::unique_ptr< table > scatter(std::vector< std::reference_wrapper< scalar const >> const &source, column_view const &indices, table_view const &target, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
根据散布映射将标量值行散布到目标表的副本中。
std::unique_ptr< table > boolean_mask_scatter(std::vector< std::reference_wrapper< scalar const >> const &input, table_view const &target, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
根据布尔掩码中为 true 的值,将标量值散布到输出表的相应行。
std::unique_ptr< column > shift(column_view const &input, size_type offset, scalar const &fill_value, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
通过偏移所有值来创建新列。
std::vector< table_view > slice(table_view const &input, std::initializer_list< size_type > indices, rmm::cuda_stream_view stream=cudf::get_default_stream())
根据索引集将 table_view 切分成 table_view 的集合。
std::vector< table_view > split(table_view const &input, std::initializer_list< size_type > splits, rmm::cuda_stream_view stream=cudf::get_default_stream())
根据预期分割衍生的索引集将 table_view 分割成 table_view 的集合。
rmm::cuda_stream_view const get_default_stream()
获取当前的默认流。
@ ALWAYS
无论对压缩的影响如何,都使用字典。
rmm::device_async_resource_ref get_current_device_resource_ref()
获取当前的设备内存资源引用。
cuda::mr::async_resource_ref< cuda::mr::device_accessible > device_async_resource_ref
int32_t size_type
列和表的行索引类型。
cudf::lists_column_view 的类定义。
cudf::strings_column_view 的类定义。
具有简化功能集的 C++20 std::span。
cudf::structs_column_view 的类定义。