命名空间 | | 类型别名 | 枚举 | 函数 | 变量
cudf 命名空间参考

cuDF 接口 更多...

命名空间

 dictionary
 字典列 API。
 
 groupby
 groupby API
 
 hashing
 哈希 API。
 
 io
 IO 接口。
 
 lists
 列表列 API。
 
 strings
 字符串列 API。
 
 tdigest
 Tdigest 接口。
 

class  host_udf_base
 基于主机的 UDF 实现的基本接口。 更多...
 
struct  reduce_host_udf
 用于归约上下文的基于主机的 UDF 实现接口。 更多...
 
struct  segmented_reduce_host_udf
 用于分段归约上下文的基于主机的 UDF 实现接口。 更多...
 
struct  groupby_host_udf
 用于 groupby 聚合上下文的基于主机的 UDF 实现接口。 更多...
 
class  aggregation
 用于在 aggregation_request 中指定所需聚合的抽象基类。 更多...
 
class  rolling_aggregation
 派生类,用于 rolling_window 特定的聚合用法。 更多...
 
class  groupby_aggregation
 派生类,用于 groupby 特定的聚合用法。 更多...
 
class  groupby_scan_aggregation
 派生类,用于 groupby 特定的扫描用法。 更多...
 
class  reduce_aggregation
 派生类,用于归约用法。 更多...
 
class  scan_aggregation
 派生类,用于扫描用法。 更多...
 
class  segmented_reduce_aggregation
 派生类,用于分段归约用法。 更多...
 
struct  binary_op_common_type
 二元操作通用类型默认。 更多...
 
struct  binary_op_common_type< L, R, std::enable_if_t< has_common_type_v< L, R > > >
 二元操作通用类型特化。 更多...
 
class  column
 作为元素列的可为空的设备数据容器。 更多...
 
struct  nullate
 在编译时或运行时指示空值的存在。 更多...
 
class  column_device_view
 作为元素列的设备数据的不可变、非拥有视图,可简单复制并可在 CUDA 设备代码中使用。 更多...
 
class  mutable_column_device_view
 作为元素列的设备数据的可变、非拥有视图,可简单复制并可在 CUDA 设备代码中使用。 更多...
 
class  column_view
 作为元素列的设备数据的非拥有、不可变视图,其中一些可能为空,由位掩码指示。 更多...
 
class  mutable_column_view
 作为元素列的设备数据的非拥有、可变视图,其中一些可能为空,由位掩码指示。 更多...
 
struct  packed_columns
 序列化格式的列数据。 更多...
 
struct  packed_table
 cudf::contiguous_split 的结果。 更多...
 
class  chunked_pack
 使用用户提供的 user_buffer_size 大小的缓冲区,对输入 table_view 执行分块“打包”操作。 更多...
 
class  dictionary_column_view
 对字典列进行操作的包装类。 更多...
 
struct  column_metadata
 arrow 数组的详细元数据信息。 更多...
 
struct  custom_view_deleter
 用于 table_view 的 unique_ptr 的自定义删除器函数对象。 更多...
 
class  hash_join
 在创建时构建哈希表并在后续 *_join 成员函数中探测结果的哈希连接。 更多...
 
class  distinct_hash_join
 在创建时构建哈希表并在后续 *_join 成员函数中探测结果的去重哈希连接。 更多...
 
class  get_json_object_options
 get_json_object() 的设置。 更多...
 
class  list_device_view
 表示任意类型元素(包括进一步嵌套列表)列表的设备数据的非拥有、不可变视图。 更多...
 
struct  list_size_functor
 按行索引返回列表大小。 更多...
 
class  list_view
 表示任意类型元素(包括进一步嵌套列表)列表的设备数据的非拥有、不可变视图。 更多...
 
class  lists_column_view
 给定列表类型的列视图,此类的实例为此复合列提供列表操作的包装。 更多...
 
struct  range_window_bounds
 窗口边界大小的抽象,用于 grouped_range_rolling_window()更多...
 
struct  bounded_closed
 有界闭合滚动窗口的强类型包装。 更多...
 
struct  bounded_open
 有界开放滚动窗口的强类型包装。 更多...
 
struct  unbounded
 无界滚动窗口的强类型包装。 更多...
 
struct  current_row
 current_row 滚动窗口的强类型包装。 更多...
 
struct  window_bounds
 窗口边界大小的抽象。 更多...
 
class  scalar
 表示单个值的拥有类。 更多...
 
class  numeric_scalar
 表示设备内存中数值的拥有类。 更多...
 
class  fixed_point_scalar
 表示设备内存中定点数的拥有类。 更多...
 
class  string_scalar
 表示设备内存中字符串的拥有类。 更多...
 
class  chrono_scalar
 表示设备内存中时间戳/持续时间值的拥有类。 更多...
 
class  timestamp_scalar
 表示设备内存中时间戳值的拥有类。 更多...
 
class  duration_scalar
 表示设备内存中持续时间值的拥有类。 更多...
 
class  list_scalar
 表示设备内存中列表值的拥有类。 更多...
 
class  struct_scalar
 表示设备内存中结构体值的拥有类。 更多...
 
class  numeric_scalar_device_view
 一种 scalar_device_view 类型,存储指向数值的指针。 更多...
 
class  fixed_point_scalar_device_view
 一种 scalar_device_view 类型,存储指向定点值的指针。 更多...
 
class  string_scalar_device_view
 一种 scalar_device_view 类型,存储指向字符串值的指针。 更多...
 
class  timestamp_scalar_device_view
 一种 scalar_device_view 类型,存储指向时间戳值的指针。 更多...
 
class  duration_scalar_device_view
 一种 scalar_device_view 类型,存储指向持续时间值的指针。 更多...
 
class  string_view
 表示 UTF-8 字符串的可变长度字符数组的设备数据的非拥有、不可变视图。 更多...
 
class  strings_column_view
 给定字符串类型的列视图,此类的实例为此复合列提供字符串操作的包装。 更多...
 
class  struct_view
 表示具有任意类型字段(包括基本类型、列表和其他结构体)的结构体的设备数据的非拥有、不可变视图。 更多...
 
class  structs_column_view
 给定结构体类型的列视图,此类的实例为此复合列提供结构体操作的包装。 更多...
 
class  element_equality_comparator
 执行两列中两个元素之间的相等性比较。 更多...
 
class  row_equality_comparator
 执行两表中两个元素之间的关系比较。 更多...
 
class  element_relational_comparator
 执行两列中两个元素之间的关系比较。 更多...
 
class  row_lexicographic_comparator
 计算一行是否字典序小于另一行。 更多...
 
class  element_hasher
 计算给定列中元素的哈希值。 更多...
 
class  element_hasher_with_seed
 用于计算列中行哈希值的函数对象。 更多...
 
class  row_hasher
 计算给定表中行的哈希值。 更多...
 
class  table
 一组相同大小的 cudf::column更多...
 
class  table_device_view
 可在设备内存中使用的表设备视图。 更多...
 
class  mutable_table_device_view
 可在设备内存中使用的可变表设备视图。 更多...
 
class  table_view
 一组相同大小的 cudf::column_view更多...
 
class  mutable_table_view
 一组相同大小的 mutable_column_view更多...
 
struct  order_info
 指示值集合的排序方式。 更多...
 
class  data_type
 列中元素的逻辑数据类型指示器。 更多...
 
struct  stacktrace_recorder
 用于在其构建时存储当前堆栈跟踪的结构体。 更多...
 
struct  logic_error
 违反逻辑前置条件时抛出的异常。 更多...
 
struct  cuda_error
 遇到 CUDA 错误时抛出的异常。 更多...
 
struct  fatal_cuda_error
 
struct  data_type_error
 尝试对不受支持的 dtype 执行操作时抛出的异常。 更多...
 
struct  pinned_mr_options
 配置默认固定内存资源的选项。 更多...
 
struct  is_host_span_supported_container
 
struct  is_host_span_supported_container< std::vector< T, Alloc > >
 
struct  is_host_span_supported_container< thrust::host_vector< T, Alloc > >
 
struct  is_host_span_supported_container< std::basic_string< T, std::char_traits< T >, Alloc > >
 
struct  host_span
 功能集缩减的 C++20 std::span。 更多...
 
struct  is_device_span_supported_container
 
struct  is_device_span_supported_container< thrust::device_vector< T, Alloc > >
 
struct  is_device_span_supported_container< rmm::device_vector< T > >
 
struct  is_device_span_supported_container< rmm::device_uvector< T > >
 
struct  device_span
 功能集缩减的 C++20 std::span 的设备版本。 更多...
 
struct  has_atomic_support_impl
 
struct  is_convertible
 
struct  is_convertible< cudf::detail::timestamp< Duration1 >, cudf::detail::timestamp< Duration2 > >
 
struct  type_to_name_impl
 cudf::type_id 类型映射到其对应的 C++ 类型名称字符串。
 
struct  id_to_type_impl
 
struct  dispatch_storage_type
 仅当您需要对底层存储类型进行操作时,才在 type_dispatcher 上使用此特化。 更多...
 
struct  type_to_scalar_type_impl
 
struct  type_to_scalar_type_impl< std::string >
 
struct  type_to_scalar_type_impl< cudf::string_view >
 
struct  type_to_scalar_type_impl< numeric::decimal32 >
 
struct  type_to_scalar_type_impl< numeric::decimal64 >
 
struct  type_to_scalar_type_impl< numeric::decimal128 >
 
struct  type_to_scalar_type_impl< cudf::dictionary32 >
 
struct  type_to_scalar_type_impl< cudf::list_view >
 
struct  type_to_scalar_type_impl< cudf::struct_view >
 
struct  dictionary_wrapper
 DICTIONARY 类型列中索引的强类型包装。 更多...
 

类型别名

template<typename L , typename R >
using binary_op_common_type_t = typename binary_op_common_type< L, R >::type
 二元操作通用类型辅助。
 
using hash_value_type = uint32_t
 哈希值类型。
 
using unique_schema_t = std::unique_ptr< ArrowSchema, void(*)(ArrowSchema *)>
 指向具有自定义删除器的 ArrowSchema 的 unique_ptr 的类型别名
 
using unique_device_array_t = std::unique_ptr< ArrowDeviceArray, void(*)(ArrowDeviceArray *)>
 指向具有自定义删除器的 ArrowDeviceArray 的 unique_ptr 的类型别名
 
using owned_columns_t = std::vector< std::unique_ptr< cudf::column > >
 拥有列向量的类型别名,用于从 ArrowDeviceArray 转换
 
using unique_table_view_t = std::unique_ptr< cudf::table_view, custom_view_deleter< cudf::table_view > >
 指向具有自定义删除器的 cudf::table_view 的 unique_ptr 的类型别名
 
using unique_column_view_t = std::unique_ptr< cudf::column_view, custom_view_deleter< cudf::column_view > >
 指向具有自定义删除器的 cudf::column_view 的 unique_ptr 的类型别名
 
using range_window_type = std::variant< unbounded, current_row, bounded_closed, bounded_open >
 基于范围的滚动窗口端点的类型。
 
using char_utf8 = uint32_t
 UTF-8 字符为 1-4 字节。
 
using size_type = int32_t
 列和表的行索引类型。
 
using bitmask_type = uint32_t
 位掩码类型,存储为 32 位无符号整数。
 
using valid_type = uint8_t
 主机内存中的有效类型。
 
using thread_index_type = int64_t
 内核中的线程索引类型。
 
template<typename... >
using void_t = void
 将任意类型序列映射到 void 类型的实用元函数。
 
template<typename L , typename R >
using less_comparable = decltype(cuda::std::declval< L >()< cuda::std::declval< R >())
 检查两种类型是否可以使用小于运算符(即 <)进行比较。
 
template<typename L , typename R >
using greater_comparable = decltype(cuda::std::declval< L >() > cuda::std::declval< R >())
 检查两种类型是否可以使用大于运算符(即 >)进行比较。
 
template<typename L , typename R >
using equality_comparable = decltype(cuda::std::declval< L >()==cuda::std::declval< R >())
 检查两种类型是否可以使用相等运算符(即 ==)进行比较。
 
template<typename... Ts>
using has_common_type = typename detail::has_common_type_impl< void, Ts... >::type
 检查类型是否具有通用类型。
 
template<typename T >
using is_timestamp_t = cuda::std::disjunction< cuda::std::is_same< cudf::timestamp_D, T >, cuda::std::is_same< cudf::timestamp_h, T >, cuda::std::is_same< cudf::timestamp_m, T >, cuda::std::is_same< cudf::timestamp_s, T >, cuda::std::is_same< cudf::timestamp_ms, T >, cuda::std::is_same< cudf::timestamp_us, T >, cuda::std::is_same< cudf::timestamp_ns, T > >
 检查类型是否为时间戳类型。
 
template<typename T >
using is_duration_t = cuda::std::disjunction< cuda::std::is_same< cudf::duration_D, T >, cuda::std::is_same< cudf::duration_h, T >, cuda::std::is_same< cudf::duration_m, T >, cuda::std::is_same< cudf::duration_s, T >, cuda::std::is_same< cudf::duration_ms, T >, cuda::std::is_same< cudf::duration_us, T >, cuda::std::is_same< cudf::duration_ns, T > >
 检查类型是否为持续时间类型。
 
template<cudf::type_id Id>
using id_to_type = typename id_to_type_impl< Id >::type
 cudf::type_id 映射到其对应的具体 C++ 类型。 更多...
 
template<typename T >
using device_storage_type_t = std::conditional_t< std::is_same_v< numeric::decimal32, T >, int32_t, std::conditional_t< std::is_same_v< numeric::decimal64, T >, int64_t, std::conditional_t< std::is_same_v< numeric::decimal128, T >, __int128_t, T > >>
 使用 cudf::column 时,“返回”存储在设备上的相应类型。 更多...
 
template<typename T >
using scalar_type_t = typename type_to_scalar_type_impl< T >::ScalarType
 将 C++ 类型映射到存储其值所需的标量类型。 更多...
 
template<typename T >
using scalar_device_type_t = typename type_to_scalar_type_impl< T >::ScalarDeviceType
 将 C++ 类型映射到存储其值所需的标量设备类型。 更多...
 
using dictionary32 = dictionary_wrapper< int32_t >
 32 位整数索引字典包装器
 
using duration_D = cuda::std::chrono::duration< int32_t, cuda::std::chrono::days::period >
 表示 int32_t 天持续时间的类型别名。
 
using duration_h = cuda::std::chrono::duration< int32_t, cuda::std::chrono::hours::period >
 表示 int32_t 小时持续时间的类型别名。
 
using duration_m = cuda::std::chrono::duration< int32_t, cuda::std::chrono::minutes::period >
 表示 int32_t 分钟持续时间的类型别名。
 
using duration_s = cuda::std::chrono::duration< int64_t, cuda::std::chrono::seconds::period >
 表示 int64_t 秒持续时间的类型别名。
 
using duration_ms = cuda::std::chrono::duration< int64_t, cuda::std::chrono::milliseconds::period >
 表示 int64_t 毫秒持续时间的类型别名。
 
using duration_us = cuda::std::chrono::duration< int64_t, cuda::std::chrono::microseconds::period >
 表示 int64_t 微秒持续时间的类型别名。
 
using duration_ns = cuda::std::chrono::duration< int64_t, cuda::std::chrono::nanoseconds::period >
 表示 int64_t 纳秒持续时间的类型别名。
 
using timestamp_D = detail::timestamp< cudf::duration_D >
 表示自 Unix 纪元以来 cudf::duration_D (int32_t) 的类型别名。
 
using timestamp_h = detail::timestamp< cudf::duration_h >
 表示自 Unix 纪元以来 cudf::duration_h (int32_t) 的类型别名。
 
using timestamp_m = detail::timestamp< cudf::duration_m >
 表示自 Unix 纪元以来 cudf::duration_m (int32_t) 的类型别名。
 
using timestamp_s = detail::timestamp< cudf::duration_s >
 表示自 Unix 纪元以来 cudf::duration_s (int64_t) 的类型别名。
 
using timestamp_ms = detail::timestamp< cudf::duration_ms >
 表示自 Unix 纪元以来 cudf::duration_ms (int64_t) 的类型别名。
 
using timestamp_us = detail::timestamp< cudf::duration_us >
 表示自 Unix 纪元以来 cudf::duration_us (int64_t) 的类型别名。
 
using timestamp_ns = detail::timestamp< cudf::duration_ns >
 表示自 Unix 纪元以来 cudf::duration_ns (int64_t) 的类型别名。
 

枚举

enum class  rank_method : int32_t {
  FIRST , AVERAGE , MIN , MAX ,
  DENSE
}
 用于对列进行排名的平局处理方法。 更多...
 
enum class  rank_percentage : int32_t { NONE , ZERO_NORMALIZED , ONE_NORMALIZED }
 返回的排名是否应为百分比,以及百分比归一化类型。 更多...
 
enum class  udf_type : bool { CUDA , PTX }
 用户定义函数字符串中的代码类型。
 
enum class  correlation_type : int32_t { PEARSON , KENDALL , SPEARMAN }
 相关性方法的类型。
 
enum class  ewm_history : int32_t { INFINITE , FINITE }
 EWM 输入值第一个值的处理类型。
 
enum class  binary_operator : int32_t {
  ADD , SUB , MUL , DIV ,
  TRUE_DIV , FLOOR_DIV , MOD , PMOD ,
  PYMOD , POW , INT_POW , LOG_BASE ,
  ATAN2 , SHIFT_LEFT , SHIFT_RIGHT , SHIFT_RIGHT_UNSIGNED ,
  BITWISE_AND , BITWISE_OR , BITWISE_XOR , LOGICAL_AND ,
  LOGICAL_OR , EQUAL , NOT_EQUAL , LESS ,
  GREATER , LESS_EQUAL , GREATER_EQUAL , NULL_EQUALS ,
  NULL_NOT_EQUALS , NULL_MAX , NULL_MIN , GENERIC_BINARY ,
  NULL_LOGICAL_AND , NULL_LOGICAL_OR , INVALID_BINARY
}
 可对数据执行的二元操作类型。 更多...
 
enum class  out_of_bounds_policy : bool { NULLIFY , DONT_CHECK }
 处理可能越界索引的策略。 更多...
 
enum class  mask_allocation_policy : int32_t { NEVER , RETAIN , ALWAYS }
 指示何时根据现有掩码分配掩码。 更多...
 
enum class  sample_with_replacement : bool { FALSE , TRUE }
 指示是否可以多次采样行。 更多...
 
enum class  nullable_join : bool { YES , NO }
 枚举类,用于指定任何输入连接表(build 表和任何后续 probe 表)是否包含空值。 更多...
 
enum class  inclusive { YES , NO }
 枚举,用于定义 bins 是否包含其边界点。
 
enum class  hash_id { HASH_IDENTITY = 0 , HASH_MURMUR3 }
 标识哈希分区中使用的哈希函数。 更多...
 
enum class  scan_type : bool { INCLUSIVE , EXCLUSIVE }
 用于描述扫描操作类型的枚举。
 
enum class  replace_policy : bool { PRECEDING , FOLLOWING }
 指定替换值相对于空行位置的策略。 更多...
 
enum class  flip_endianness : bool { NO , YES }
 配置字节转换是否翻转字节序。
 
enum class  rounding_method : int32_t { HALF_UP , HALF_EVEN }
 cudf::round 的不同舍入方法。 更多...
 
enum class  duplicate_keep_option { KEEP_ANY = 0 , KEEP_FIRST , KEEP_LAST , KEEP_NONE }
 drop_duplicates API 保留重复行的选项。 更多...
 
enum class  weak_ordering { LESS , EQUIVALENT , GREATER }
 element_relational_comparator 函数对象的结果类型。 更多...
 
enum class  order : bool { ASCENDING , DESCENDING }
 指示元素应按何种顺序排序。 更多...
 
enum class  null_policy : bool { EXCLUDE , INCLUDE }
 枚举,指定是否包含空值或排除空值。 更多...
 
enum class  nan_policy : bool { NAN_IS_NULL , NAN_IS_VALID }
 枚举,将 NaN 浮点值视为 null 或非 null 元素。 更多...
 
enum class  nan_equality { ALL_EQUAL , UNEQUAL }
 枚举,考虑持有 NaN 值的不同元素(浮点类型)是否相等或不相等。 更多...
 
enum class  null_equality : bool { EQUAL , UNEQUAL }
 枚举,考虑两个 null 是否相等或不相等。 更多...
 
enum class  null_order : bool { AFTER , BEFORE }
 指示空值如何与其他所有值进行比较。 更多...
 
enum class  sorted : bool { NO , YES }
 指示值集合是否已知已排序。
 
enum class  mask_state : int32_t { UNALLOCATED , UNINITIALIZED , ALL_VALID , ALL_NULL }
 控制空值掩码的分配/初始化。 更多...
 
enum class  interpolation : int32_t {
  LINEAR , LOWER , HIGHER , MIDPOINT ,
  NEAREST
}
 当所需分位数介于两个数据点 i 和 j 之间时使用的插值方法。 更多...
 
enum class  type_id : int32_t {
  EMPTY , INT8 , INT16 , INT32 ,
  INT64 , UINT8 , UINT16 , UINT32 ,
  UINT64 , FLOAT32 , FLOAT64 , BOOL8 ,
  TIMESTAMP_DAYS , TIMESTAMP_SECONDS , TIMESTAMP_MILLISECONDS , TIMESTAMP_MICROSECONDS ,
  TIMESTAMP_NANOSECONDS , DURATION_DAYS , DURATION_SECONDS , DURATION_MILLISECONDS ,
  DURATION_MICROSECONDS , DURATION_NANOSECONDS , DICTIONARY32 , STRING ,
  LIST , DECIMAL32 , DECIMAL64 , DECIMAL128 ,
  STRUCT , NUM_TYPE_IDS
}
 标识列的逻辑元素类型。 更多...
 
enum class  unary_operator : int32_t {
  SIN , COS , TAN , ARCSIN ,
  ARCCOS , ARCTAN , SINH , COSH ,
  TANH , ARCSINH , ARCCOSH , ARCTANH ,
  EXP , LOG , SQRT , CBRT ,
  CEIL , FLOOR , ABS , RINT ,
  BIT_INVERT , NOT , NEGATE
}
 可对数据执行的一元操作类型。 更多...
 

函数

template<typename Base = aggregation>
std::unique_ptr< Base > make_sum_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_product_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_min_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_max_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_count_aggregation (null_policy null_handling=null_policy::EXCLUDE)
 创建 COUNT 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_any_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_all_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_histogram_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_sum_of_squares_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_mean_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_m2_aggregation ()
 创建 M2 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_variance_aggregation (size_type ddof=1)
 创建 VARIANCE 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_std_aggregation (size_type ddof=1)
 创建 STD 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_median_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_quantile_aggregation (std::vector< double > const &quantiles, interpolation interp=interpolation::LINEAR)
 创建 QUANTILE 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_argmax_aggregation ()
 创建 ARGMAX 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_argmin_aggregation ()
 创建 ARGMIN 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_nunique_aggregation (null_policy null_handling=null_policy::EXCLUDE)
 创建 NUNIQUE 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_nth_element_aggregation (size_type n, null_policy null_handling=null_policy::INCLUDE)
 创建 NTH_ELEMENT 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_row_number_aggregation ()
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_ewma_aggregation (double const center_of_mass, ewm_history history)
 创建 EWMA 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_rank_aggregation (rank_method method, order column_order=order::ASCENDING, null_policy null_handling=null_policy::EXCLUDE, null_order null_precedence=null_order::AFTER, rank_percentage percentage=rank_percentage::NONE)
 创建 RANK 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_collect_list_aggregation (null_policy null_handling=null_policy::INCLUDE)
 创建 COLLECT_LIST 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_collect_set_aggregation (null_equality nulls_equal=null_equality::EQUAL, nan_equality nans_equal=nan_equality::ALL_EQUAL)
 创建 COLLECT_SET 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_lag_aggregation (size_type offset)
 创建 LAG 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_lead_aggregation (size_type offset)
 创建 LEAD 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_udf_aggregation (udf_type type, std::string const &user_defined_aggregator, data_type output_type)
 基于 PTX 或 CUDA 的 UDF 创建聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_host_udf_aggregation (std::unique_ptr< host_udf_base > host_udf)
 创建 HOST_UDF 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_merge_lists_aggregation ()
 创建 MERGE_LISTS 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_merge_sets_aggregation (null_equality nulls_equal=null_equality::EQUAL, nan_equality nans_equal=nan_equality::ALL_EQUAL)
 创建 MERGE_SETS 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_merge_m2_aggregation ()
 创建 MERGE_M2 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_merge_histogram_aggregation ()
 创建 MERGE_HISTOGRAM 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_covariance_aggregation (size_type min_periods=1, size_type ddof=1)
 创建 COVARIANCE 聚合的工厂方法。 更多...
 
template<typename Base = aggregation>
std::unique_ptr< Base > make_correlation_aggregation (correlation_type type, size_type min_periods=1)
 创建 CORRELATION 聚合的工厂方法。 更多...
 
template<typename Base >
std::unique_ptr< Base > make_tdigest_aggregation (int max_centroids=1000)
 创建 TDIGEST 聚合的工厂方法。 更多...
 
template<typename Base >
std::unique_ptr< Base > make_merge_tdigest_aggregation (int max_centroids=1000)
 创建 MERGE_TDIGEST 聚合的工厂方法。 更多...
 
std::unique_ptr< columnbinary_operation (scalar const &lhs, column_view const &rhs, binary_operator op, data_type output_type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在标量和列之间执行二元操作。 更多...
 
std::unique_ptr< columnbinary_operation (column_view const &lhs, scalar const &rhs, binary_operator op, data_type output_type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在列和标量之间执行二元操作。 更多...
 
std::unique_ptr< columnbinary_operation (column_view const &lhs, column_view const &rhs, binary_operator op, data_type output_type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在两列之间执行二元操作。 更多...
 
std::unique_ptr< columnbinary_operation (column_view const &lhs, column_view const &rhs, std::string const &ptx, data_type output_type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用用户定义的 PTX 函数对两个列执行二元操作。 更多信息...
 
int32_t binary_operation_fixed_point_scale (binary_operator op, int32_t left_scale, int32_t right_scale)
 根据给定的二元运算符 op 计算 fixed_point(定点数)的 scale(缩放)值。 更多信息...
 
cudf::data_type binary_operation_fixed_point_output_type (binary_operator op, cudf::data_type const &lhs, cudf::data_type const &rhs)
 根据给定的二元运算符 op 计算 fixed_point(定点数)的 data_type(数据类型)。 更多信息...
 
std::unique_ptr< columnmake_empty_column (data_type type)
 创建指定 type 的空列。 更多信息...
 
std::unique_ptr< columnmake_empty_column (type_id id)
 创建指定类型的空列。 更多信息...
 
std::unique_ptr< columnmake_numeric_column (data_type type, size_type size, mask_state state=mask_state::UNALLOCATED, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定数字 data_typesize 个元素,并带有可选的空值掩码。 更多信息...
 
template<typename B >
std::unique_ptr< columnmake_numeric_column (data_type type, size_type size, B &&null_mask, size_type null_count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定数字 data_typesize 个元素,并带有空值掩码。 更多信息...
 
std::unique_ptr< columnmake_fixed_point_column (data_type type, size_type size, mask_state state=mask_state::UNALLOCATED, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定 fixed_point(定点数) data_typesize 个元素,并带有可选的空值掩码。 更多信息...
 
template<typename B >
std::unique_ptr< columnmake_fixed_point_column (data_type type, size_type size, B &&null_mask, size_type null_count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定 fixed_point(定点数) data_typesize 个元素,并带有空值掩码。 更多信息...
 
std::unique_ptr< columnmake_timestamp_column (data_type type, size_type size, mask_state state=mask_state::UNALLOCATED, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定时间戳 data_typesize 个元素,并带有可选的空值掩码。 更多信息...
 
template<typename B >
std::unique_ptr< columnmake_timestamp_column (data_type type, size_type size, B &&null_mask, size_type null_count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定时间戳 data_typesize 个元素,并带有空值掩码。 更多信息...
 
std::unique_ptr< columnmake_duration_column (data_type type, size_type size, mask_state state=mask_state::UNALLOCATED, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定持续时间 data_typesize 个元素,并带有可选的空值掩码。 更多信息...
 
template<typename B >
std::unique_ptr< columnmake_duration_column (data_type type, size_type size, B &&null_mask, size_type null_count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定持续时间 data_typesize 个元素,并带有空值掩码。 更多信息...
 
std::unique_ptr< columnmake_fixed_width_column (data_type type, size_type size, mask_state state=mask_state::UNALLOCATED, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定固定宽度 data_typesize 个元素,并带有可选的空值掩码。 更多信息...
 
template<typename B >
std::unique_ptr< columnmake_fixed_width_column (data_type type, size_type size, B &&null_mask, size_type null_count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造具有足够未初始化存储空间的列,以容纳指定固定宽度 data_typesize 个元素,并带有空值掩码。 更多信息...
 
std::unique_ptr< columnmake_strings_column (cudf::device_span< thrust::pair< char const *, size_type > const > strings, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 给定指针/大小对的设备 span,构造一个 STRING(字符串)类型的列。 更多信息...
 
std::vector< std::unique_ptr< column > > make_strings_column_batch (std::vector< cudf::device_span< thrust::pair< char const *, size_type > const >> const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 给定指针/大小对的设备 span 数组,构造一批 STRING(字符串)类型的列。 更多信息...
 
std::unique_ptr< columnmake_strings_column (cudf::device_span< string_view const > string_views, string_view const null_placeholder, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 给定 string_view 的设备 span,构造一个 STRING(字符串)类型的列。 更多信息...
 
std::unique_ptr< columnmake_strings_column (size_type num_strings, std::unique_ptr< column > offsets_column, rmm::device_buffer &&chars_buffer, size_type null_count, rmm::device_buffer &&null_mask)
 给定偏移量列、字符列、空值掩码和空值计数,构造一个 STRING(字符串)类型的列。 更多信息...
 
std::unique_ptr< cudf::columnmake_lists_column (size_type num_rows, std::unique_ptr< column > offsets_column, std::unique_ptr< column > child_column, size_type null_count, rmm::device_buffer &&null_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 给定偏移量列、子列、空值掩码和空值计数,构造一个 LIST(列表)类型的列。 更多信息...
 
std::unique_ptr< columnmake_empty_lists_column (data_type child_type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个空的 LIST(列表)列。 更多信息...
 
std::unique_ptr< cudf::columnmake_structs_column (size_type num_rows, std::vector< std::unique_ptr< column >> &&child_columns, size_type null_count, rmm::device_buffer &&null_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用指定的子列作为成员,构造一个 STRUCT(结构体)列。 更多信息...
 
std::unique_ptr< columnmake_column_from_scalar (scalar const &s, size_type size, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造一个包含 size 个元素的列,所有元素都等于给定的标量。 更多信息...
 
std::unique_ptr< columnmake_dictionary_from_scalar (scalar const &s, size_type size, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造一个字典列,包含 size 个元素,所有元素都等于给定的标量。 更多信息...
 
size_type count_descendants (column_view parent)
 计算指定父列的后代数量。 更多信息...
 
column_view bit_cast (column_view const &input, data_type type)
 在大小相同且底层表示兼容的类型之间执行零拷贝转换。 更多信息...
 
mutable_column_view bit_cast (mutable_column_view const &input, data_type type)
 在大小相同且底层表示兼容的类型之间执行零拷贝转换。 更多信息...
 
rmm::device_buffer concatenate_masks (host_span< column_view const > views, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将所有 views 元素的 views[i] 位掩码从位 [views[i].offset(), views[i].offset() + views[i].size()) 连接到一个 rmm::device_buffer 中。 更多信息...
 
std::unique_ptr< columnconcatenate (host_span< column_view const > columns_to_concat, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将多个列连接成一个列。 更多信息...
 
std::unique_ptr< tableconcatenate (host_span< table_view const > tables_to_concat, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 tables_to_concat 中的列垂直连接以返回一个单一的表。 更多信息...
 
std::vector< packed_tablecontiguous_split (cudf::table_view const &input, std::vector< size_type > const &splits, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 table_view 深拷贝拆分为 packed_table 的向量,其中每个 packed_table 使用单个连续内存块存储所有拆分出的列数据。 更多信息...
 
packed_columns pack (cudf::table_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 table_view 深拷贝到序列化的连续内存格式中。 更多信息...
 
std::vector< uint8_t > pack_metadata (table_view const &table, uint8_t const *contiguous_buffer, size_t buffer_size)
 生成用于打包存储在连续缓冲区中的表的元数据。 更多信息...
 
table_view unpack (packed_columns const &input)
 反序列化 cudf::pack 的结果。 更多信息...
 
table_view unpack (uint8_t const *metadata, uint8_t const *gpu_data)
 反序列化 cudf::pack 的结果。 更多信息...
 
std::unique_ptr< tablegather (table_view const &source_table, column_view const &gather_map, out_of_bounds_policy bounds_policy=out_of_bounds_policy::DONT_CHECK, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 收集指定行(包括空值)的列集合。 更多信息...
 
std::unique_ptr< tablereverse (table_view const &source_table, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 反转表中的行顺序。 更多信息...
 
std::unique_ptr< columnreverse (column_view const &source_column, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 反转列中的元素顺序。 更多信息...
 
std::unique_ptr< tablescatter (table_view const &source, column_view const &scatter_map, table_view const &target, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据散布映射,将源表的行散布到目标表的副本中。 更多信息...
 
std::unique_ptr< tablescatter (std::vector< std::reference_wrapper< scalar const >> const &source, column_view const &indices, table_view const &target, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据散布映射,将一行标量值散布到目标表的副本中。 更多信息...
 
std::unique_ptr< columnempty_like (column_view const &input)
 初始化并返回一个与 input 类型相同的空列。 更多信息...
 
std::unique_ptr< columnempty_like (scalar const &input)
 初始化并返回一个与 input 类型相同的空列。 更多信息...
 
std::unique_ptr< columnallocate_like (column_view const &input, mask_allocation_policy mask_alloc=mask_allocation_policy::RETAIN, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个与 input 大小和类型相同但未初始化的新列。 更多信息...
 
std::unique_ptr< columnallocate_like (column_view const &input, size_type size, mask_allocation_policy mask_alloc=mask_allocation_policy::RETAIN, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个指定大小且与 input 类型相同但未初始化的新列。 更多信息...
 
std::unique_ptr< tableempty_like (table_view const &input_table)
 创建一个由与 input_table 具有相同类型的空列组成的表。 更多信息...
 
void copy_range_in_place (column_view const &source, mutable_column_view &target, size_type source_begin, size_type source_end, size_type target_begin, rmm::cuda_stream_view stream=cudf::get_default_stream())
 将一个列中的元素范围原地复制到另一个列中。 更多信息...
 
std::unique_ptr< columncopy_range (column_view const &source, column_view const &target, size_type source_begin, size_type source_end, size_type target_begin, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将一个列中的元素范围非原地复制到另一个列中。 更多信息...
 
std::unique_ptr< columnshift (column_view const &input, size_type offset, scalar const &fill_value, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过按偏移量移动所有值来创建新列。 更多信息...
 
std::vector< column_viewslice (column_view const &input, host_span< size_type const > indices, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组索引,将一个 column_view 切片成一组 column_view更多信息...
 
std::vector< column_viewslice (column_view const &input, std::initializer_list< size_type > indices, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组索引,将一个 column_view 切片成一组 column_view更多信息...
 
std::vector< table_viewslice (table_view const &input, host_span< size_type const > indices, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组索引,将一个 table_view 切片成一组 table_view更多信息...
 
std::vector< table_viewslice (table_view const &input, std::initializer_list< size_type > indices, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组索引,将一个 table_view 切片成一组 table_view更多信息...
 
std::vector< column_viewsplit (column_view const &input, host_span< size_type const > splits, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组由预期拆分点确定的索引,将一个 column_view 拆分成一组 column_view更多信息...
 
std::vector< column_viewsplit (column_view const &input, std::initializer_list< size_type > splits, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组由预期拆分点确定的索引,将一个 column_view 拆分成一组 column_view更多信息...
 
std::vector< table_viewsplit (table_view const &input, host_span< size_type const > splits, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组由预期拆分点确定的索引,将一个 table_view 拆分成一组 table_view更多信息...
 
std::vector< table_viewsplit (table_view const &input, std::initializer_list< size_type > splits, rmm::cuda_stream_view stream=cudf::get_default_stream())
 根据一组由预期拆分点确定的索引,将一个 table_view 拆分成一组 table_view更多信息...
 
std::unique_ptr< columncopy_if_else (column_view const &lhs, column_view const &rhs, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个新列,其中每个元素根据 boolean_mask 中相应元素的值从 lhsrhs 中选择。 更多信息...
 
std::unique_ptr< columncopy_if_else (scalar const &lhs, column_view const &rhs, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个新列,其中每个元素根据 boolean_mask 中相应元素的值从 lhsrhs 中选择。 更多信息...
 
std::unique_ptr< columncopy_if_else (column_view const &lhs, scalar const &rhs, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个新列,其中每个元素根据 boolean_mask 中相应元素的值从 lhsrhs 中选择。 更多信息...
 
std::unique_ptr< columncopy_if_else (scalar const &lhs, scalar const &rhs, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回一个新列,其中每个元素根据 boolean_mask 中相应元素的值从 lhsrhs 中选择。 更多信息...
 
std::unique_ptr< tableboolean_mask_scatter (table_view const &input, table_view const &target, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据布尔掩码中的真值对应的行,将输入表中的行散布到输出表的行中。 更多信息...
 
std::unique_ptr< tableboolean_mask_scatter (std::vector< std::reference_wrapper< scalar const >> const &input, table_view const &target, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据布尔掩码中的真值对应的行,将标量值散布到输出表的行中。 更多信息...
 
std::unique_ptr< scalarget_element (column_view const &input, size_type index, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从列中获取指定索引处的元素。 更多信息...
 
std::unique_ptr< tablesample (table_view const &input, size_type const n, sample_with_replacement replacement=sample_with_replacement::FALSE, int64_t const seed=0, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 input 中随机收集 n 个样本。 更多信息...
 
bool has_nonempty_nulls (column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream())
 检查列或其后代是否包含非空的空值行。 更多信息...
 
bool may_have_nonempty_nulls (column_view const &input)
 近似判断列或其后代*可能*是否包含非空的空值元素。 更多信息...
 
std::unique_ptr< columnpurge_nonempty_nulls (column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 input 复制到输出,同时清除列或其后代中的非空空值行。 更多信息...
 
std::unique_ptr< columnmake_dictionary_column (column_view const &keys_column, column_view const &indices_column, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过复制提供的 keys(键)和 indices(索引),构造一个字典列。 更多信息...
 
std::unique_ptr< columnmake_dictionary_column (std::unique_ptr< column > keys_column, std::unique_ptr< column > indices_column, rmm::device_buffer &&null_mask, size_type null_count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过接管提供的键列和索引列的所有权,构造一个字典列。 更多信息...
 
std::unique_ptr< columnmake_dictionary_column (std::unique_ptr< column > keys_column, std::unique_ptr< column > indices_column, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过接管提供的键列和索引列的所有权,构造一个字典列。 更多信息...
 
void fill_in_place (mutable_column_view &destination, size_type begin, size_type end, scalar const &value, rmm::cuda_stream_view stream=cudf::get_default_stream())
 使用标量值在列中原地填充一个元素范围。 更多信息...
 
std::unique_ptr< columnfill (column_view const &input, size_type begin, size_type end, scalar const &value, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用标量值非原地填充列中的元素范围。 更多信息...
 
std::unique_ptr< tablerepeat (table_view const &input_table, column_view const &count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 重复表中的行。 更多信息...
 
std::unique_ptr< tablerepeat (table_view const &input_table, size_type count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 重复表中的行。 更多信息...
 
std::unique_ptr< columnsequence (size_type size, scalar const &init, scalar const &step, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用由初始值和步长指定的值序列填充列。 更多信息...
 
std::unique_ptr< columnsequence (size_type size, scalar const &init, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用指定的初始值和步长为 1 填充列。更多...
 
std::unique_ptr< cudf::columncalendrical_month_sequence (size_type size, scalar const &init, size_type months, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 生成从 init 开始的时间戳序列,后续每个元素递增 months,即对于 [0, size) 中的 ioutput[i] = init + i * months更多...
 
std::unique_ptr< tablefrom_dlpack (DLManagedTensor const *managed_tensor, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将 DLPack DLTensor 转换为 cudf 表。更多...
 
DLManagedTensor * to_dlpack (table_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将 cudf 表转换为 DLPack DLTensor。更多...
 
unique_schema_t to_arrow_schema (cudf::table_view const &input, cudf::host_span< column_metadata const > metadata)
 从 cudf 表和元数据创建 ArrowSchema。更多...
 
unique_device_array_t to_arrow_device (cudf::table &&table, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从 cudf 表和元数据创建 ArrowDeviceArray更多...
 
unique_device_array_t to_arrow_device (cudf::column &&col, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从 cudf 列和元数据创建 ArrowDeviceArray更多...
 
unique_device_array_t to_arrow_device (cudf::table_view const &table, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从表视图创建 ArrowDeviceArray更多...
 
unique_device_array_t to_arrow_device (cudf::column_view const &col, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从列视图创建 ArrowDeviceArray更多...
 
unique_device_array_t to_arrow_host (cudf::table_view const &table, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将表视图数据复制到主机并为其创建 ArrowDeviceArray更多...
 
unique_device_array_t to_arrow_host (cudf::column_view const &col, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列视图数据复制到主机并为其创建 ArrowDeviceArray更多...
 
std::unique_ptr< cudf::tablefrom_arrow (ArrowSchema const *schema, ArrowArray const *input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 ArrowArray 和 ArrowSchema 输入创建 `cudf::table`。更多...
 
std::unique_ptr< cudf::columnfrom_arrow_column (ArrowSchema const *schema, ArrowArray const *input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 ArrowArray 和 ArrowSchema 输入创建 `cudf::column`。更多...
 
std::unique_ptr< tablefrom_arrow_host (ArrowSchema const *schema, ArrowDeviceArray const *input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 ArrowDeviceArray 输入创建 `cudf::table`。更多...
 
std::unique_ptr< tablefrom_arrow_stream (ArrowArrayStream *input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 ArrowArrayStream 输入创建 `cudf::table`。更多...
 
std::unique_ptr< columnfrom_arrow_host_column (ArrowSchema const *schema, ArrowDeviceArray const *input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 ArrowDeviceArray 输入创建 `cudf::column`。更多...
 
unique_table_view_t from_arrow_device (ArrowSchema const *schema, ArrowDeviceArray const *input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 ArrowDeviceArrayArrowSchema 创建 `cudf::table_view`。更多...
 
unique_column_view_t from_arrow_device_column (ArrowSchema const *schema, ArrowDeviceArray const *input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定的 ArrowDeviceArrayArrowSchema 创建 `cudf::column_view`。更多...
 
bool is_runtime_jit_supported ()
 根据是否支持运行时 JIT 操作返回 true/false。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > inner_join (cudf::table_view const &left_keys, cudf::table_view const &right_keys, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间的内连接相对应的行索引向量对。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > left_join (cudf::table_view const &left_keys, cudf::table_view const &right_keys, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间的左连接相对应的行索引向量对。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > full_join (cudf::table_view const &left_keys, cudf::table_view const &right_keys, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间的全连接相对应的行索引向量对。更多...
 
std::unique_ptr< rmm::device_uvector< size_type > > left_semi_join (cudf::table_view const &left_keys, cudf::table_view const &right_keys, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间的左半连接相对应的行索引向量。更多...
 
std::unique_ptr< rmm::device_uvector< size_type > > left_anti_join (cudf::table_view const &left_keys, cudf::table_view const &right_keys, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间的左反连接相对应的行索引向量。更多...
 
std::unique_ptr< cudf::tablecross_join (cudf::table_view const &left, cudf::table_view const &right, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对两个表 (left, right) 执行交叉连接更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > conditional_inner_join (table_view const &left, table_view const &right, ast::expression const &binary_predicate, std::optional< std::size_t > output_size={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间所有谓词评估为 true 的行对相对应的行索引向量对。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > conditional_left_join (table_view const &left, table_view const &right, ast::expression const &binary_predicate, std::optional< std::size_t > output_size={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间所有谓词评估为 true 的行对相对应的行索引向量对,或者左表中在右表中没有匹配项的行的空匹配。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > conditional_full_join (table_view const &left, table_view const &right, ast::expression const &binary_predicate, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间所有谓词评估为 true 的行对相对应的行索引向量对,或者在任一表中没有在另一表中找到匹配项的行的空匹配。更多...
 
std::unique_ptr< rmm::device_uvector< size_type > > conditional_left_semi_join (table_view const &left, table_view const &right, ast::expression const &binary_predicate, std::optional< std::size_t > output_size={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与左表中所有行对应的索引向量,这些行在右表中存在某个谓词评估为 true 的行。更多...
 
std::unique_ptr< rmm::device_uvector< size_type > > conditional_left_anti_join (table_view const &left, table_view const &right, ast::expression const &binary_predicate, std::optional< std::size_t > output_size={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与左表中所有行对应的索引向量,这些行在右表中不存在任何谓词评估为 true 的行。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > mixed_inner_join (table_view const &left_equality, table_view const &right_equality, table_view const &left_conditional, table_view const &right_conditional, ast::expression const &binary_predicate, null_equality compare_nulls=null_equality::EQUAL, std::optional< std::pair< std::size_t, device_span< size_type const >>> output_size_data={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间所有行对相对应的行索引向量对,其中相等表的列相等且谓词在条件表上评估为 true。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > mixed_left_join (table_view const &left_equality, table_view const &right_equality, table_view const &left_conditional, table_view const &right_conditional, ast::expression const &binary_predicate, null_equality compare_nulls=null_equality::EQUAL, std::optional< std::pair< std::size_t, device_span< size_type const >>> output_size_data={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间所有行对相对应的行索引向量对,其中相等表的列相等且谓词在条件表上评估为 true,或者左表中在右表中没有匹配项的行的空匹配。更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > mixed_full_join (table_view const &left_equality, table_view const &right_equality, table_view const &left_conditional, table_view const &right_conditional, ast::expression const &binary_predicate, null_equality compare_nulls=null_equality::EQUAL, std::optional< std::pair< std::size_t, device_span< size_type const >>> output_size_data={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与指定表之间所有行对相对应的行索引向量对,其中相等表的列相等且谓词在条件表上评估为 true,或者在任一对表中没有在另一对表中找到匹配项的行的空匹配。更多...
 
std::unique_ptr< rmm::device_uvector< size_type > > mixed_left_semi_join (table_view const &left_equality, table_view const &right_equality, table_view const &left_conditional, table_view const &right_conditional, ast::expression const &binary_predicate, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与左表中所有行对应的索引向量,其中相等表的列相等且谓词在条件表上评估为 true。更多...
 
std::unique_ptr< rmm::device_uvector< size_type > > mixed_left_anti_join (table_view const &left_equality, table_view const &right_equality, table_view const &left_conditional, table_view const &right_conditional, ast::expression const &binary_predicate, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与左表中所有行对应的索引向量,在右表中没有与这些行对应的行,其中相等表的列相等且谓词在条件表上评估为 true。更多...
 
std::pair< std::size_t, std::unique_ptr< rmm::device_uvector< size_type > > > mixed_inner_join_size (table_view const &left_equality, table_view const &right_equality, table_view const &left_conditional, table_view const &right_conditional, ast::expression const &binary_predicate, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在指定表之间执行混合内连接时,返回精确的匹配数(行数),其中相等表的列相等且谓词在条件表上评估为 true。更多...
 
std::pair< std::size_t, std::unique_ptr< rmm::device_uvector< size_type > > > mixed_left_join_size (table_view const &left_equality, table_view const &right_equality, table_view const &left_conditional, table_view const &right_conditional, ast::expression const &binary_predicate, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在指定表之间执行混合左连接时,返回精确的匹配数(行数),其中相等表的列相等且谓词在条件表上评估为 true。更多...
 
std::size_t conditional_inner_join_size (table_view const &left, table_view const &right, ast::expression const &binary_predicate, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在指定表之间执行条件内连接时,返回精确的匹配数(行数),其中谓词评估为 true。更多...
 
std::size_t conditional_left_join_size (table_view const &left, table_view const &right, ast::expression const &binary_predicate, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在指定表之间执行条件左连接时,返回精确的匹配数(行数),其中谓词评估为 true。更多...
 
std::size_t conditional_left_semi_join_size (table_view const &left, table_view const &right, ast::expression const &binary_predicate, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在指定表之间执行条件左半连接时,返回精确的匹配数(行数),其中谓词评估为 true。更多...
 
std::size_t conditional_left_anti_join_size (table_view const &left, table_view const &right, ast::expression const &binary_predicate, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在指定表之间执行条件左反连接时,返回精确的匹配数(行数),其中谓词评估为 true。更多...
 
std::unique_ptr< cudf::columnget_json_object (cudf::strings_column_view const &col, cudf::string_scalar const &json_path, get_json_object_options options=get_json_object_options{}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将 JSONPath 字符串应用于输入字符串列中的所有行。更多...
 
std::unique_ptr< columnlabel_bins (column_view const &input, column_view const &left_edges, inclusive left_inclusive, column_view const &right_edges, inclusive right_inclusive, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据指定 bin 中的成员资格标记元素。更多...
 
std::unique_ptr< tableexplode (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素。更多...
 
std::unique_ptr< tableexplode_position (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素并包含位置列。更多...
 
std::unique_ptr< tableexplode_outer (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素,保留其中的任何空条目或空列表。更多...
 
std::unique_ptr< tableexplode_outer_position (table_view const &input_table, size_type explode_column_idx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 展开列表列的元素,保留其中的任何空条目或空列表,并包含位置列。更多...
 
CUDF_HOST_DEVICE auto make_list_size_iterator (detail::lists_column_device_view const &c)
 创建一个迭代器,按行索引返回列表的大小。更多...
 
rapids_logger::sink_ptr default_logger_sink ()
 返回全局记录器的默认接收器。更多...
 
std::string default_logger_pattern ()
 返回全局记录器的默认日志模式。更多...
 
rapids_logger::logger & default_logger ()
 获取默认记录器。更多...
 
std::unique_ptr< cudf::tablemerge (std::vector< table_view > const &tables_to_merge, std::vector< cudf::size_type > const &key_cols, std::vector< cudf::order > const &column_order, std::vector< cudf::null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 合并一组已排序的表。更多...
 
size_type state_null_count (mask_state state, size_type size)
 返回表示 `size` 个元素的指定 `state` 的空掩码的空计数。更多...
 
std::size_t bitmask_allocation_size_bytes (size_type number_of_bits, std::size_t padding_boundary=64)
 计算表示指定位数和给定填充边界所需的字节数。更多...
 
size_type num_bitmask_words (size_type number_of_bits)
 返回表示指定位数所需的 `bitmask_type` 字数。更多...
 
rmm::device_buffer create_null_mask (size_type size, mask_state state, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个 `device_buffer` 用作 `column` 的空值指示位掩码。更多...
 
void set_null_mask (bitmask_type *bitmask, size_type begin_bit, size_type end_bit, bool valid, rmm::cuda_stream_view stream=cudf::get_default_stream())
 将预分配的位掩码缓冲区在范围 [begin_bit, end_bit) 内设置为给定状态更多...
 
rmm::device_buffer copy_bitmask (bitmask_type const *mask, size_type begin_bit, size_type end_bit, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从由索引范围 [begin_bit, end_bit) 定义的位掩码切片创建一个 `device_buffer`。更多...
 
rmm::device_buffer copy_bitmask (column_view const &view, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 view 的位掩码从位 [view.offset(), view.offset() + view.size()) 复制到 device_buffer更多...
 
std::pair< rmm::device_buffer, size_typebitmask_and (table_view const &view, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表的列的位掩码执行按位 AND 运算。返回结果掩码和未设置位数计数的对。更多...
 
std::pair< rmm::device_buffer, size_typebitmask_or (table_view const &view, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表的列的位掩码执行按位 OR 运算。返回结果掩码和未设置位数计数的对。更多...
 
cudf::size_type null_count (bitmask_type const *bitmask, size_type start, size_type stop, rmm::cuda_stream_view stream=cudf::get_default_stream())
 给定有效性位掩码,计算范围 [start, stop) 中空元素(未设置位)的数量。更多...
 
std::pair< std::unique_ptr< table >, std::vector< size_type > > partition (table_view const &t, column_view const &partition_map, size_type num_partitions, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据 partition_map 指定的映射对表 t 的行进行分区。更多...
 
std::pair< std::unique_ptr< table >, std::vector< size_type > > hash_partition (table_view const &input, std::vector< size_type > const &columns_to_hash, int num_partitions, hash_id hash_function=hash_id::HASH_MURMUR3, uint32_t seed=DEFAULT_HASH_SEED, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将输入表中的行分区到多个输出表中。更多...
 
std::pair< std::unique_ptr< cudf::table >, std::vector< cudf::size_type > > round_robin_partition (table_view const &input, cudf::size_type num_partitions, cudf::size_type start_partition=0, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 轮询分区。更多...
 
std::unique_ptr< columnquantile (column_view const &input, std::vector< double > const &q, interpolation interp=interpolation::LINEAR, column_view const &ordered_indices={}, bool exact=true, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算带插值的分位数。更多...
 
std::unique_ptr< tablequantiles (table_view const &input, std::vector< double > const &q, interpolation interp=interpolation::NEAREST, cudf::sorted is_input_sorted=sorted::NO, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回与请求的分位数相对应的输入行。更多...
 
std::unique_ptr< columnpercentile_approx (tdigest::tdigest_column_view const &input, column_view const &percentiles, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算输入 tdigest 列的近似百分位数。更多...
 
std::unique_ptr< scalarreduce (column_view const &col, reduce_aggregation const &agg, data_type output_dtype, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算列中所有行的值归约。更多...
 
std::unique_ptr< scalarreduce (column_view const &col, reduce_aggregation const &agg, data_type output_dtype, std::optional< std::reference_wrapper< scalar const >> init, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用初始值计算列中所有行的值归约。更多...
 
std::unique_ptr< columnsegmented_reduce (column_view const &segmented_values, device_span< size_type const > offsets, segmented_reduce_aggregation const &agg, data_type output_dtype, null_policy null_handling, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算输入列中每个分段的归约。更多...
 
std::unique_ptr< columnsegmented_reduce (column_view const &segmented_values, device_span< size_type const > offsets, segmented_reduce_aggregation const &agg, data_type output_dtype, null_policy null_handling, std::optional< std::reference_wrapper< scalar const >> init, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用初始值计算输入列中每个分段的归约。仅支持 SUM、PRODUCT、MIN、MAX、ANY 和 ALL 聚合。更多...
 
std::unique_ptr< columnscan (column_view const &input, scan_aggregation const &agg, scan_type inclusive, null_policy null_handling=null_policy::EXCLUDE, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算列的扫描。更多...
 
std::pair< std::unique_ptr< scalar >, std::unique_ptr< scalar > > minmax (column_view const &col, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 确定列的最小值和最大值。更多...
 
std::unique_ptr< columnreplace_nulls (column_view const &input, column_view const &replacement, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列中的所有空值替换为另一列的相应值。更多...
 
std::unique_ptr< columnreplace_nulls (column_view const &input, scalar const &replacement, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列中的所有空值替换为一个标量。更多...
 
std::unique_ptr< columnreplace_nulls (column_view const &input, replace_policy const &replace_policy, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列中的所有空值替换为前一个/后一个非空值。更多...
 
std::unique_ptr< columnreplace_nans (column_view const &input, column_view const &replacement, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列中的所有 NaN 值替换为另一列的相应值。更多...
 
std::unique_ptr< columnreplace_nans (column_view const &input, scalar const &replacement, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列中的所有 NaN 值替换为一个标量。更多...
 
std::unique_ptr< columnfind_and_replace_all (column_view const &input_col, column_view const &values_to_replace, column_view const &replacement_values, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回 input_col 的副本,将找到的任何 values_to_replace[i] 替换为 replacement_values[i]更多...
 
std::unique_ptr< columnclamp (column_view const &input, scalar const &lo, scalar const &lo_replace, scalar const &hi, scalar const &hi_replace, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 input 中小于 lo 的值替换为 lo_replace,将大于 hi 的值替换为 hi_replace更多...
 
std::unique_ptr< columnclamp (column_view const &input, scalar const &lo, scalar const &hi, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 input 中小于 lo 的值替换为 lo,将大于 hi 的值替换为 hi更多...
 
std::unique_ptr< columnnormalize_nans_and_zeros (column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从浮点元素列中复制,并将 -NaN-0.0 分别替换为 +NaN+0.0
 
void normalize_nans_and_zeros (mutable_column_view &in_out, rmm::cuda_stream_view stream=cudf::get_default_stream())
 修改浮点元素列,将所有 -NaN-0.0 分别替换为 +NaN+0.0更多...
 
std::unique_ptr< columninterleave_columns (table_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将表中的列交错组合成单列。更多...
 
std::unique_ptr< tabletile (table_view const &input, size_type count, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 input 表中的行重复 count 次以形成新表。更多...
 
std::unique_ptr< columnbyte_cast (column_view const &input_column, flip_endianness endian_configuration, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列的元素转换为字节列表。更多...
 
std::pair< std::unique_ptr< column >, std::unique_ptr< column > > make_range_windows (table_view const &group_keys, column_view const &orderby, order order, null_order null_order, range_window_type preceding, range_window_type following, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据窗口范围规范构造前置列和后置列。更多...
 
std::unique_ptr< columnrolling_window (column_view const &input, size_type preceding_window, size_type following_window, size_type min_periods, rolling_aggregation const &agg, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用固定大小的滚动窗口函数。更多...
 
std::unique_ptr< columnrolling_window (column_view const &input, column_view const &default_outputs, size_type preceding_window, size_type following_window, size_type min_periods, rolling_aggregation const &agg, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用固定大小的滚动窗口函数。更多...
 
std::unique_ptr< columngrouped_rolling_window (table_view const &group_keys, column_view const &input, size_type preceding_window, size_type following_window, size_type min_periods, rolling_aggregation const &aggr, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用分组感知、固定大小的滚动窗口函数。更多...
 
std::unique_ptr< columngrouped_rolling_window (table_view const &group_keys, column_view const &input, window_bounds preceding_window, window_bounds following_window, size_type min_periods, rolling_aggregation const &aggr, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用分组感知、固定大小的滚动窗口函数。更多...
 
std::unique_ptr< columngrouped_rolling_window (table_view const &group_keys, column_view const &input, column_view const &default_outputs, size_type preceding_window, size_type following_window, size_type min_periods, rolling_aggregation const &aggr, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用分组感知、固定大小的滚动窗口函数。更多...
 
std::unique_ptr< columngrouped_rolling_window (table_view const &group_keys, column_view const &input, column_view const &default_outputs, window_bounds preceding_window, window_bounds following_window, size_type min_periods, rolling_aggregation const &aggr, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用分组感知、固定大小的滚动窗口函数。更多...
 
std::unique_ptr< columngrouped_range_rolling_window (table_view const &group_keys, column_view const &orderby_column, cudf::order const &order, column_view const &input, range_window_bounds const &preceding, range_window_bounds const &following, size_type min_periods, rolling_aggregation const &aggr, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用分组感知、基于值范围的滚动窗口函数。更多...
 
std::unique_ptr< columnrolling_window (column_view const &input, column_view const &preceding_window, column_view const &following_window, size_type min_periods, rolling_aggregation const &agg, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的值应用变长大小的滚动窗口函数。更多...
 
std::unique_ptr< columnround (column_view const &input, int32_t decimal_places=0, rounding_method method=rounding_method::HALF_UP, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将列中的所有值四舍五入到指定的小数位数。更多...
 
template<typename T >
auto get_scalar_device_view (numeric_scalar< T > &s)
 获取 numeric_scalar 的设备视图。更多...
 
auto get_scalar_device_view (string_scalar &s)
 获取 string_scalar 的设备视图。更多...
 
template<typename T >
auto get_scalar_device_view (timestamp_scalar< T > &s)
 获取 timestamp_scalar 的设备视图。更多...
 
template<typename T >
auto get_scalar_device_view (duration_scalar< T > &s)
 获取 duration_scalar 的设备视图。更多...
 
template<typename T >
auto get_scalar_device_view (fixed_point_scalar< T > &s)
 获取 fixed_point_scalar 的设备视图。更多...
 
std::unique_ptr< scalarmake_numeric_scalar (data_type type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造一个标量,其未初始化的存储用于存储指定数值 data_type 的值。更多...
 
std::unique_ptr< scalarmake_timestamp_scalar (data_type type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造一个标量,其未初始化的存储用于存储指定时间戳 data_type 的值。更多...
 
std::unique_ptr< scalarmake_duration_scalar (data_type type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造一个标量,其未初始化的存储用于存储指定时长 data_type 的值。更多...
 
std::unique_ptr< scalarmake_fixed_width_scalar (data_type type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造一个标量,其未初始化的存储用于存储指定固定宽度 data_type 的值。更多...
 
std::unique_ptr< scalarmake_string_scalar (std::string const &string, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 给定 std::string 构造 STRING 类型的标量。std::string 的大小不得超过 size_type 的最大值。字符串字符应为 UTF-8 编码的 char 字节序列。更多...
 
std::unique_ptr< scalarmake_default_constructed_scalar (data_type type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 构造类型为 type 的默认构造标量 更多...
 
std::unique_ptr< scalarmake_empty_scalar_like (column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个与 input column_view 类型相同的空(无效)标量。更多...
 
template<typename T >
std::unique_ptr< scalarmake_fixed_width_scalar (T value, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用给定固定宽度类型的值构造标量。更多...
 
template<typename T >
std::unique_ptr< scalarmake_fixed_point_scalar (typename T::rep value, numeric::scale_type scale, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用给定 fixed_point 类型的值构造标量。更多...
 
std::unique_ptr< scalarmake_list_scalar (column_view elements, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用给定元素列构造标量。更多...
 
std::unique_ptr< scalarmake_struct_scalar (table_view const &data, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用给定 table_view 构造结构体标量。更多...
 
std::unique_ptr< scalarmake_struct_scalar (host_span< column_view const > data, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用给定的列视图 span 构造结构体标量。更多...
 
std::unique_ptr< columnlower_bound (table_view const &haystack, table_view const &needles, std::vector< order > const &column_order, std::vector< null_order > const &null_precedence, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在排序表中查找应插入值以保持顺序的最小索引。更多...
 
std::unique_ptr< columnupper_bound (table_view const &haystack, table_view const &needles, std::vector< order > const &column_order, std::vector< null_order > const &null_precedence, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 在排序表中查找应插入值以保持顺序的最大索引。更多...
 
bool contains (column_view const &haystack, scalar const &needle, rmm::cuda_stream_view stream=cudf::get_default_stream())
 检查给定 needle 值是否存在于 haystack 列中。更多...
 
std::unique_ptr< columncontains (column_view const &haystack, column_view const &needles, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 检查给定 needles 值是否存在于 haystack 列中。更多...
 
std::unique_ptr< columnsorted_order (table_view const &input, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算使 input 按字典序排序的行索引。更多...
 
std::unique_ptr< columnstable_sorted_order (table_view const &input, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算使 input 按稳定字典序排序的行索引。更多...
 
bool is_sorted (cudf::table_view const &table, std::vector< order > const &column_order, std::vector< null_order > const &null_precedence, rmm::cuda_stream_view stream=cudf::get_default_stream())
 检查 table 的行是否按字典序排序。更多...
 
std::unique_ptr< tablesort (table_view const &input, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表的行进行字典序排序。更多...
 
std::unique_ptr< tablestable_sort (table_view const &input, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表的行进行稳定字典序排序。更多...
 
std::unique_ptr< tablesort_by_key (table_view const &values, table_view const &keys, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 执行键值排序。更多...
 
std::unique_ptr< tablestable_sort_by_key (table_view const &values, table_view const &keys, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 执行键值稳定排序。更多...
 
std::unique_ptr< columnrank (column_view const &input, rank_method method, order column_order, null_policy null_handling, null_order null_precedence, bool percentage, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 计算输入列按排序顺序的排名。更多...
 
std::unique_ptr< columnsegmented_sorted_order (table_view const &keys, column_view const &segment_offsets, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表中每个分段排序后返回排序顺序。更多...
 
std::unique_ptr< columnstable_segmented_sorted_order (table_view const &keys, column_view const &segment_offsets, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表中每个分段稳定排序后返回排序顺序。更多...
 
std::unique_ptr< tablesegmented_sort_by_key (table_view const &values, table_view const &keys, column_view const &segment_offsets, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表进行字典序分段排序。更多...
 
std::unique_ptr< tablestable_segmented_sort_by_key (table_view const &values, table_view const &keys, column_view const &segment_offsets, std::vector< order > const &column_order={}, std::vector< null_order > const &null_precedence={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对表进行稳定字典序分段排序。更多...
 
std::unique_ptr< tabledrop_nulls (table_view const &input, std::vector< size_type > const &keys, cudf::size_type keep_threshold, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据阈值数量过滤表以移除 null 元素。更多...
 
std::unique_ptr< tabledrop_nulls (table_view const &input, std::vector< size_type > const &keys, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 过滤表以移除 null 元素。更多...
 
std::unique_ptr< tabledrop_nans (table_view const &input, std::vector< size_type > const &keys, cudf::size_type keep_threshold, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 根据阈值数量过滤表以移除 NAN。更多...
 
std::unique_ptr< tabledrop_nans (table_view const &input, std::vector< size_type > const &keys, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 过滤表以移除 NAN。更多...
 
std::unique_ptr< tableapply_boolean_mask (table_view const &input, column_view const &boolean_mask, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 使用布尔值 boolean_mask 作为掩码过滤 input更多...
 
std::unique_ptr< tableunique (table_view const &input, std::vector< size_type > const &keys, duplicate_keep_option keep, null_equality nulls_equal=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个新表,删除连续重复的行。更多...
 
std::unique_ptr< tabledistinct (table_view const &input, std::vector< size_type > const &keys, duplicate_keep_option keep=duplicate_keep_option::KEEP_ANY, null_equality nulls_equal=null_equality::EQUAL, nan_equality nans_equal=nan_equality::ALL_EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个没有重复行的新表。更多...
 
std::unique_ptr< columndistinct_indices (table_view const &input, duplicate_keep_option keep=duplicate_keep_option::KEEP_ANY, null_equality nulls_equal=null_equality::EQUAL, nan_equality nans_equal=nan_equality::ALL_EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建输入表中所有不同行的索引列。更多...
 
std::unique_ptr< tablestable_distinct (table_view const &input, std::vector< size_type > const &keys, duplicate_keep_option keep=duplicate_keep_option::KEEP_ANY, null_equality nulls_equal=null_equality::EQUAL, nan_equality nans_equal=nan_equality::ALL_EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个没有重复行的新表,并保留输入顺序。更多...
 
cudf::size_type unique_count (column_view const &input, null_policy null_handling, nan_policy nan_handling, rmm::cuda_stream_view stream=cudf::get_default_stream())
 计算列中连续的等价行组的数量。更多...
 
cudf::size_type unique_count (table_view const &input, null_equality nulls_equal=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream())
 计算表中连续的等价行组的数量。更多...
 
cudf::size_type distinct_count (column_view const &input, null_policy null_handling, nan_policy nan_handling, rmm::cuda_stream_view stream=cudf::get_default_stream())
 计算 column_view 中的不同元素数量。更多...
 
cudf::size_type distinct_count (table_view const &input, null_equality nulls_equal=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream())
 计算表中的不同行数量。更多...
 
template<typename Element , std::enable_if_t< std::is_floating_point_v< Element >> * = nullptr>
CUDF_HOST_DEVICE Fixed relational_compare (Element lhs, Element rhs)
 浮点 Element 类型关系比较的特化,用于推导元素相对于 lhs 的顺序。更多...
 
auto null_compare (bool lhs_is_null, bool rhs_is_null, null_order null_precedence)
 根据 null 顺序比较 null。更多...
 
template<typename Element , std::enable_if_t< std::is_floating_point_v< Element >> * = nullptr>
bool equality_compare (Element lhs, Element rhs)
 浮点 Element 类型的特化,用于检查 lhs 是否等价于 rhsnan == nan更多...
 
template<typename ColumnDeviceView , typename HostTableView >
auto contiguous_copy_column_device_views (HostTableView source_view, rmm::cuda_stream_view stream)
 table_view 的内容复制到连续设备内存中的列设备视图。更多...
 
bool has_nested_columns (table_view const &table)
 确定给定表中是否存在任何嵌套列。更多...
 
bool nullable (table_view const &view)
 如果表中任何列可为 null,则返回 True。(不包括整个层次结构)更多...
 
bool has_nulls (table_view const &view)
 如果表的任何列中包含 null,则返回 True。更多...
 
bool has_nested_nulls (table_view const &input)
 如果表的任何列层次结构中包含 null,则返回 True。更多...
 
bool has_nested_nullable_columns (table_view const &input)
 如果表的列层次结构中任意级别包含可为 null 的列,则返回 True。更多...
 
std::vector< column_viewget_nullable_columns (table_view const &table)
 在给定表中收集所有嵌套级别中所有可为 null 的列的函数。更多...
 
table_view scatter_columns (table_view const &source, std::vector< size_type > const &map, table_view const &target)
 根据列索引映射将 table_view 中的列视图复制到另一个 table_view 中。更多...
 
std::unique_ptr< tablemake_timezone_transition_table (std::optional< std::string_view > tzif_dir, std::string_view timezone_name, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建转换表以将 ORC 时间戳转换为 UTC。更多...
 
std::unique_ptr< columntransform (std::vector< column_view > const &inputs, std::string const &transform_udf, data_type output_type, bool is_ptx, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过对输入列的每个元素应用转换函数来创建新列。更多...
 
std::pair< std::unique_ptr< rmm::device_buffer >, size_typenans_to_nulls (column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过将 NaN 转换为 null 并保留现有 null 值,从 input 创建 null_mask,并返回新的 null 计数。更多...
 
std::unique_ptr< columncompute_column (table_view const &table, ast::expression const &expr, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过对表中的表达式树进行求值来计算新列。更多...
 
std::pair< std::unique_ptr< rmm::device_buffer >, cudf::size_typebools_to_mask (column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从布尔元素列创建位掩码。更多...
 
std::pair< std::unique_ptr< cudf::table >, std::unique_ptr< cudf::column > > encode (cudf::table_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将给定表的行编码为整数。更多...
 
std::pair< std::unique_ptr< column >, table_viewone_hot_encode (column_view const &input, column_view const &categories, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 通过为 categories 中的每个值生成一个新列来编码 input,该列指示该值在 input 中是否存在。更多...
 
std::unique_ptr< columnmask_to_bools (bitmask_type const *bitmask, size_type begin_bit, size_type end_bit, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 从给定位掩码创建布尔列。更多...
 
std::unique_ptr< columnrow_bit_count (table_view const &t, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回 table_view 中所有列的每行近似累积大小(以位为单位)。更多...
 
std::unique_ptr< columnsegmented_row_bit_count (table_view const &t, size_type segment_length, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 返回 table_view 中所有列的每行分段近似累积大小(以位为单位)。更多...
 
std::pair< std::unique_ptr< column >, table_viewtranspose (table_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 转置一个表。更多...
 
template<typename T >
size_type distance (T f, T l)
 类似于 std::distance,但返回 cudf::size_type 并执行 static_cast 更多...
 
constexpr bool operator== (data_type const &lhs, data_type const &rhs)
 比较两个 data_type 对象是否相等。更多...
 
bool operator!= (data_type const &lhs, data_type const &rhs)
 比较两个 data_type 对象是否不相等。更多...
 
std::size_t size_of (data_type t)
 返回指定 data_type 元素的字节大小。更多...
 
template<typename Fixed , typename Floating , CUDF_ENABLE_IF(cuda::std::is_floating_point_v< Floating > &&is_fixed_point< Fixed >()) >
CUDF_HOST_DEVICE Fixed convert_floating_to_fixed (Floating floating, numeric::scale_type scale)
 将浮点值转换为定点值。更多...
 
template<typename Floating , typename Fixed , CUDF_ENABLE_IF(cuda::std::is_floating_point_v< Floating > &&is_fixed_point< Fixed >()) >
CUDF_HOST_DEVICE Floating convert_fixed_to_floating (Fixed fixed)
 将定点值转换为浮点。 更多...
 
template<typename Floating , typename Input , CUDF_ENABLE_IF(cuda::std::is_floating_point_v< Floating >) >
CUDF_HOST_DEVICE Floating convert_to_floating (Input input)
 将值转换为浮点。 更多...
 
std::unique_ptr< cudf::columnunary_operation (cudf::column_view const &input, cudf::unary_operator op, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 对列中的所有值执行一元操作 op。 更多...
 
std::unique_ptr< cudf::columnis_null (cudf::column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个包含type_id::BOOL8元素的列,其中对于input中的每个元素,true表示该值为null,而false表示该值有效。 更多...
 
std::unique_ptr< cudf::columnis_valid (cudf::column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个包含type_id::BOOL8元素的列,其中对于input中的每个元素,true表示该值有效,而false表示该值为null。 更多...
 
std::unique_ptr< columncast (column_view const &input, data_type out_type, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 将输入中指定的数据类型数据转换为输出中指定的数据类型。 更多...
 
bool is_supported_cast (data_type from, data_type to) noexcept
 检查两种数据类型之间的转换是否受支持。 更多...
 
std::unique_ptr< columnis_nan (cudf::column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个包含type_id::BOOL8元素的列,指示浮点值列中是否存在NaN值。如果input中行i的元素为NAN,则输出中行i的元素为true,否则为false更多...
 
std::unique_ptr< columnis_not_nan (cudf::column_view const &input, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
 创建一个包含type_id::BOOL8元素的列,指示浮点值列中不存在NaN值。如果input中行i的元素为NAN,则输出中行i的元素为false,否则为true更多...
 
constexpr CUDF_HOST_DEVICE size_type word_index (size_type bit_index)
 返回包含指定位的字的索引。 更多...
 
constexpr CUDF_HOST_DEVICE size_type intra_word_index (size_type bit_index)
 返回指定位在字内的位置。 更多...
 
CUDF_HOST_DEVICE void set_bit_unsafe (bitmask_type *bitmask, size_type bit_index)
 将指定位设置为1 更多...
 
CUDF_HOST_DEVICE void clear_bit_unsafe (bitmask_type *bitmask, size_type bit_index)
 将指定位设置为0 更多...
 
CUDF_HOST_DEVICE bool bit_is_set (bitmask_type const *bitmask, size_type bit_index)
 指示指定位是否设置为1 更多...
 
CUDF_HOST_DEVICE bool bit_value_or (bitmask_type const *bitmask, size_type bit_index, bool default_value)
 类似optional的接口,用于检查位掩码的指定位是否已设置。 更多...
 
constexpr CUDF_HOST_DEVICE bitmask_type set_least_significant_bits (size_type n)
 返回一个位掩码字,其中设置了n个最低有效位。 更多...
 
constexpr CUDF_HOST_DEVICE bitmask_type set_most_significant_bits (size_type n)
 返回一个位掩码字,其中设置了n个最高有效位。 更多...
 
rmm::cuda_stream_view const get_default_stream ()
 获取当前的默认流。 更多...
 
bool is_ptds_enabled ()
 检查是否启用了每线程默认流。 更多...
 
rmm::mr::device_memory_resourceget_current_device_resource ()
 获取当前的设备内存资源。 更多...
 
rmm::device_async_resource_ref get_current_device_resource_ref ()
 获取当前的设备内存资源引用。 更多...
 
rmm::mr::device_memory_resourceset_current_device_resource (rmm::mr::device_memory_resource *mr)
 设置当前的设备内存资源。 更多...
 
rmm::device_async_resource_ref set_current_device_resource_ref (rmm::device_async_resource_ref mr)
 设置当前的设备内存资源引用。 更多...
 
rmm::device_async_resource_ref reset_current_device_resource_ref ()
 将当前的设备内存资源引用重置为初始资源。 更多...
 
rmm::host_device_async_resource_ref set_pinned_memory_resource (rmm::host_device_async_resource_ref mr)
 设置用于固定内存分配的rmm资源。 更多...
 
rmm::host_device_async_resource_ref get_pinned_memory_resource ()
 获取用于固定内存分配的rmm资源。 更多...
 
bool config_default_pinned_memory_resource (pinned_mr_options const &opts)
 配置默认固定内存资源的大小。 更多...
 
void set_kernel_pinned_copy_threshold (size_t threshold)
 设置使用内核进行固定内存复制的阈值大小。 更多...
 
size_t get_kernel_pinned_copy_threshold ()
 获取使用内核进行固定内存复制的阈值大小。 更多...
 
void set_allocate_host_as_pinned_threshold (size_t threshold)
 设置将主机内存分配为固定内存的阈值大小。 更多...
 
size_t get_allocate_host_as_pinned_threshold ()
 获取将主机内存分配为固定内存的阈值大小。 更多...
 
template<typename T >
constexpr bool has_atomic_support ()
 指示类型T是否支持原子操作。 更多...
 
constexpr bool has_atomic_support (data_type type)
 指示type是否支持原子操作。 更多...
 
template<typename L , typename R >
constexpr bool is_relationally_comparable ()
 指示类型LR的对象是否可以进行关系比较。 更多...
 
bool is_relationally_comparable (data_type type)
 检查data_type type是否支持关系比较。 更多...
 
template<typename L , typename R >
constexpr bool is_equality_comparable ()
 指示类型LR的对象是否可以比较相等性。 更多...
 
bool is_equality_comparable (data_type type)
 检查data_type type是否支持相等性比较。 更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_numeric ()
 指示类型T是否为数值类型。 更多...
 
bool is_numeric (data_type type)
 指示type是否为数值型data_type更多...
 
template<typename T >
constexpr bool is_index_type ()
 指示类型T是否为索引类型。 更多...
 
bool is_index_type (data_type type)
 指示类型type是否为索引类型。 更多...
 
template<typename T >
constexpr bool is_signed ()
 指示类型T是否为有符号数值类型。 更多...
 
bool is_signed (data_type type)
 指示type是否为有符号数值型data_type更多...
 
template<typename T >
constexpr bool is_unsigned ()
 指示类型T是否为无符号数值类型。 更多...
 
bool is_unsigned (data_type type)
 指示type是否为无符号数值型data_type更多...
 
template<typename Iterator >
constexpr CUDF_HOST_DEVICE bool is_signed_iterator ()
 指示Iterator值类型是否为无符号。 更多...
 
template<typename T >
constexpr bool is_integral ()
 指示类型T是否为整型。 更多...
 
bool is_integral (data_type type)
 指示type是否为整型data_type更多...
 
template<typename T >
constexpr bool is_integral_not_bool ()
 指示类型T是否为整型但非布尔型。 更多...
 
bool is_integral_not_bool (data_type type)
 指示type是否为整型data_type且非BOOL8。 更多...
 
template<typename T >
constexpr bool is_numeric_not_bool ()
 指示类型T是否为数值型但非布尔型。 更多...
 
bool is_numeric_not_bool (data_type type)
 指示type是否为数值型data_type但非BOOL8。 更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_floating_point ()
 指示类型T是否为浮点型。 更多...
 
bool is_floating_point (data_type type)
 指示type是否为浮点型data_type更多...
 
template<typename T >
constexpr bool is_byte ()
 指示T是否为std::byte类型。 更多...
 
template<typename T >
constexpr bool is_boolean ()
 指示T是否为布尔类型。 更多...
 
bool is_boolean (data_type type)
 指示type是否为布尔型data_type更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_timestamp ()
 指示类型T是否为时间戳类型。 更多...
 
bool is_timestamp (data_type type)
 指示type是否为时间戳data_type更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_fixed_point ()
 指示类型T是否为定点类型。 更多...
 
bool is_fixed_point (data_type type)
 指示type是否为定点data_type更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_duration ()
 指示类型T是否为持续时间类型。 更多...
 
bool is_duration (data_type type)
 指示type是否为持续时间data_type更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_chrono ()
 指示类型T是否为chrono类型。 更多...
 
bool is_chrono (data_type type)
 指示type是否为chronodata_type更多...
 
template<typename T >
constexpr bool is_rep_layout_compatible ()
 指示T是否与其“表示”类型布局兼容。 更多...
 
template<typename T >
constexpr bool is_dictionary ()
 指示类型T是否为字典类型。 更多...
 
bool is_dictionary (data_type type)
 指示type是否为字典data_type更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_fixed_width ()
 指示类型T的元素是否固定宽度。 更多...
 
bool is_fixed_width (data_type type)
 指示type的元素是否固定宽度。 更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_compound ()
 指示类型T是否为复合类型。 更多...
 
bool is_compound (data_type type)
 指示type的元素是否为复合类型。 更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE bool is_nested ()
 指示T是否为嵌套类型。 更多...
 
bool is_nested (data_type type)
 指示type是否为嵌套类型。 更多...
 
bool is_bit_castable (data_type from, data_type to)
 指示from是否可以位转换为to更多...
 
bool column_types_equivalent (column_view const &lhs, column_view const &rhs)
 比较两个column_view的类型ID。 更多...
 
bool have_same_types (column_view const &lhs, column_view const &rhs)
 比较两个column_view的类型。 更多...
 
bool have_same_types (column_view const &lhs, scalar const &rhs)
 比较column_viewscalar的类型 更多...
 
bool have_same_types (scalar const &lhs, column_view const &rhs)
 比较scalarcolumn_view的类型 更多...
 
bool have_same_types (scalar const &lhs, scalar const &rhs)
 比较两个scalar的类型。 更多...
 
bool have_same_types (table_view const &lhs, table_view const &rhs)
 检查两个table_view是否具有相同类型的列。 更多...
 
template<typename ForwardIt >
bool all_have_same_types (ForwardIt first, ForwardIt last)
 比较一系列column_viewscalar对象的类型。 更多...
 
template<typename T >
constexpr CUDF_HOST_DEVICE type_id base_type_to_id ()
 将C++类型映射到其对应的cudf::type_id 更多...
 
template<typename T >
constexpr type_id type_to_id ()
 将C++类型映射到其对应的cudf::type_id 更多...
 
template<>
constexpr type_id base_type_to_id< char > ()
 将“char”类型映射到type_id::INT8的特化。 更多...
 
template<typename T >
constexpr bool type_id_matches_device_storage_type (type_id id)
 检查类似fixed_point的类型是否具有与列存储的类型ID匹配的模板类型T更多...
 
template<template< cudf::type_id > typename IdTypeMap = id_to_type_impl, typename Functor , typename... Ts>
CUDF_HOST_DEVICE constexpr decltype(auto) __forceinline__ type_dispatcher (cudf::data_type dtype, Functor f, Ts &&... args)
 基于指定的cudf::data_typeid(),使用类型实例化调用operator()模板。 更多...
 
template<template< cudf::type_id > typename IdTypeMap = id_to_type_impl, typename F , typename... Ts>
CUDF_HOST_DEVICE constexpr decltype(auto) __forceinline__ double_type_dispatcher (cudf::data_type type1, cudf::data_type type2, F &&f, Ts &&... args)
 将两个类型模板参数分派给可调用对象。 更多...
 
std::string type_to_name (data_type type)
 返回给定类型的名称。 更多...
 
template<typename Integer >
CUDF_HOST_DEVICE bool operator== (dictionary_wrapper< Integer > const &lhs, dictionary_wrapper< Integer > const &rhs)
 dictionary_wrapper的等于运算符。 更多...
 
template<typename Integer >
CUDF_HOST_DEVICE bool operator!= (dictionary_wrapper< Integer > const &lhs, dictionary_wrapper< Integer > const &rhs)
 dictionary_wrapper的不等于运算符。 更多...
 
template<typename Integer >
CUDF_HOST_DEVICE bool operator<= (dictionary_wrapper< Integer > const &lhs, dictionary_wrapper< Integer > const &rhs)
 dictionary_wrapper的小于或等于运算符。 更多...
 
template<typename Integer >
CUDF_HOST_DEVICE bool operator>= (dictionary_wrapper< Integer > const &lhs, dictionary_wrapper< Integer > const &rhs)
 dictionary_wrapper的大于或等于运算符。 更多...
 
template<typename Integer >
constexpr CUDF_HOST_DEVICE bool operator< (dictionary_wrapper< Integer > const &lhs, dictionary_wrapper< Integer > const &rhs)
 dictionary_wrapper的小于运算符。 更多...
 
template<typename Integer >
CUDF_HOST_DEVICE bool operator> (dictionary_wrapper< Integer > const &lhs, dictionary_wrapper< Integer > const &rhs)
 dictionary_wrapper的大于运算符。 更多...
 

变量

template<typename L , typename R >
constexpr bool binary_op_has_common_type_v
 检查二元操作类型是否具有共同类型。 更多...
 
constexpr std::size_t dynamic_extent = std::numeric_limits<std::size_t>::max()
 用于区分静态和动态范围std::span的常量。
 
template<typename... Ts>
constexpr bool has_common_type_v = detail::has_common_type_impl<void, Ts...>::value
 has_common_type<>::value的辅助变量模板。
 

详细说明

cuDF接口

枚举类型文档

◆ weak_ordering

enum cudf::weak_ordering
strong

element_relational_comparator函数对象的返回类型。

指示两个元素ab如何相互比较。

等价定义为not (a<b) and not (b<a)。等价的元素不一定*相等*。

枚举器
LESS 

指示a小于(排列在b之前)

EQUIVALENT 

指示a既不排列在b之前,也不排列在b之后

GREATER 

指示a大于(排列在b之后)

定义于文件row_operators.cuh43行。

函数文档

◆ all_have_same_types()

template<typename ForwardIt >
bool cudf::all_have_same_types ( ForwardIt  first,
ForwardIt  last 
)
inline

比较一系列column_viewscalar对象的类型。

如果范围中的所有对象都具有相同类型(在cudf::have_same_types的意义上),则此函数返回true。

模板参数
ForwardIt正向迭代器
参数
first第一个迭代器
last最后一个迭代器
返回
如果所有类型都匹配,则为true

定义于文件type_checks.hpp124行。

◆ bit_cast() [1/2]

column_view cudf::bit_cast ( column_view const &  input,
data_type  type 
)

在具有相同大小和兼容底层表示的类型之间进行零拷贝转换。

这类似于reinterpret_castbit_cast,因为它提供了对不同类型相同原始位的视图。然而,与reinterpret_cast不同,此转换仅允许在具有相同宽度和兼容表示的类型上进行。例如,时间戳类型在内存中的布局等同于表示自固定纪元以来的持续时间的整数;位转换为相同的整数类型(天为INT32,其他为INT64)会得到持续时间计数的原始视图。FLOAT32也可以位转换为INT32并视为整数值。但是,INT32列不能位转换为INT64,因为大小不同,string_view列也不能转换为数值类型列,因为它们的数据表示不兼容。

可以使用cudf::is_bit_castable()检查转换的有效性。

异常
cudf::logic_error如果指定的转换不可能,即is_bit_castable(input.type(), type)为false。
参数
input要转换的column_view
type要转换为的data_type
返回
新的column_view,封装与input相同的数据,但转换为type

◆ bit_cast() [2/2]

mutable_column_view cudf::bit_cast ( mutable_column_view const &  input,
data_type  type 
)

在具有相同大小和兼容底层表示的类型之间进行零拷贝转换。

这类似于reinterpret_castbit_cast,因为它提供了对不同类型相同原始位的视图。然而,与reinterpret_cast不同,此转换仅允许在具有相同宽度和兼容表示的类型上进行。例如,时间戳类型在内存中的布局等同于表示自固定纪元以来的持续时间的整数;位转换为相同的整数类型(天为INT32,其他为INT64)会得到持续时间计数的原始视图。FLOAT32也可以位转换为INT32并视为整数值。但是,INT32列不能位转换为INT64,因为大小不同,string_view列也不能转换为数值类型列,因为它们的数据表示不兼容。

可以使用cudf::is_bit_castable()检查转换的有效性。

异常
cudf::logic_error如果指定的转换不可能,即is_bit_castable(input.type(), type)为false。
参数
input要转换的mutable_column_view
type要转换为的data_type
返回
新的mutable_column_view,封装与input相同的数据,但转换为type

◆ column_types_equivalent()

bool cudf::column_types_equivalent ( column_view const &  lhs,
column_view const &  rhs 
)

比较两个column_view的类型ID。

如果lhs的类型等于rhs的类型,则此函数返回true。

  • 对于定点类型,忽略比例。
参数
lhs要比较的第一个column_view
rhs要比较的第二个column_view
返回
如果列类型匹配,则为true

◆ config_default_pinned_memory_resource()

bool cudf::config_default_pinned_memory_resource ( pinned_mr_options const &  opts)

配置默认固定内存资源的大小。

参数
opts配置默认固定内存资源的选项
返回
如果此调用成功配置了固定内存资源,则为True;如果资源已配置,则为false。

◆ contiguous_copy_column_device_views()

template<typename ColumnDeviceView , typename HostTableView >
auto cudf::contiguous_copy_column_device_views ( HostTableView  source_view,
rmm::cuda_stream_view  stream 
)

table_view的内容复制到连续设备内存中的列设备视图。

模板参数
ColumnDeviceView要复制到的列设备视图类型
HostTableView要复制的table_view的类型
参数
source_view要复制的table_view
stream用于设备内存分配的流
返回
device_buffer 和 ColumnDeviceView device pointer 的 tuple

定义于文件 table_device_view.cuh242 行。

◆ count_descendants()

size_type cudf::count_descendants ( column_view  parent)

统计指定父节点的后代数量。

参数
parent将统计其后代数量的父节点
返回
父节点的后代数量

◆ default_logger()

rapids_logger::logger& cudf::default_logger ( )

获取默认 logger。

返回
logger& 默认 logger

◆ default_logger_pattern()

std::string cudf::default_logger_pattern ( )

返回全局 logger 的默认日志模式。

返回
std::string 默认日志模式。

◆ default_logger_sink()

rapids_logger::sink_ptr cudf::default_logger_sink ( )

返回全局 logger 的默认 sink。

如果定义了环境变量 CUDF_DEBUG_LOG_FILE,默认的 sink 是指向该文件的 sink。否则,默认输出到 stderr。

返回
sink_ptr 要使用的 sink

◆ equality_compare() [1/5]

template<typename Element , std::enable_if_t< std::is_floating_point_v< Element >> * = nullptr>
bool cudf::equality_compare ( Element  lhs,
Element  rhs 
)

针对浮点 Element 类型的特化,检查 lhs 是否等同于 rhsnan == nan

针对非浮点 Element 类型的特化,检查 lhs 是否等同于 rhs

参数
lhs第一个元素
rhs第二个元素
返回
如果 lhs == rhs 则为 true,否则为 false

定义于文件 row_operators.cuh136 行。

◆ get_allocate_host_as_pinned_threshold()

size_t cudf::get_allocate_host_as_pinned_threshold ( )

获取将 host memory 分配为 pinned memory 的阈值大小。

返回
以字节为单位的阈值大小。

◆ get_kernel_pinned_copy_threshold()

size_t cudf::get_kernel_pinned_copy_threshold ( )

获取使用 kernel 进行 pinned memory 复制的阈值大小。

返回
以字节为单位的阈值大小。

◆ get_nullable_columns()

std::vector<column_view> cudf::get_nullable_columns ( table_view const &  table)

该函数用于收集给定 table 中所有嵌套层级的可空列。

参数
table输入的 table
返回
一个 vector,包含输入 table 中所有可空列

◆ get_pinned_memory_resource()

rmm::host_device_async_resource_ref cudf::get_pinned_memory_resource ( )

获取用于 pinned memory 分配的 rmm resource。

返回
用于 pinned 分配的 rmm resource

◆ get_scalar_device_view() [1/5]

template<typename T >
auto cudf::get_scalar_device_view ( duration_scalar< T > &  s)

获取 duration_scalar 的 device view。

参数
s要获取 device view 的 duration_scalar
返回
duration_scalar 的 device view

定义于文件 scalar_device_view.cuh426 行。

◆ get_scalar_device_view() [2/5]

template<typename T >
auto cudf::get_scalar_device_view ( fixed_point_scalar< T > &  s)

获取 fixed_point_scalar 的 device view。

参数
s要获取 device view 的 fixed_point_scalar
返回
fixed_point_scalar 的 device view

定义于文件 scalar_device_view.cuh438 行。

◆ get_scalar_device_view() [3/5]

template<typename T >
auto cudf::get_scalar_device_view ( numeric_scalar< T > &  s)

获取 numeric_scalar 的 device view。

参数
s要获取 device view 的 numeric_scalar
返回
numeric_scalar 的 device view

定义于文件 scalar_device_view.cuh391 行。

◆ get_scalar_device_view() [4/5]

auto cudf::get_scalar_device_view ( string_scalar s)
inline

获取 string_scalar 的 device view。

参数
s要获取 device view 的 string_scalar
返回
string_scalar 的 device view

定义于文件 scalar_device_view.cuh402 行。

◆ get_scalar_device_view() [5/5]

template<typename T >
auto cudf::get_scalar_device_view ( timestamp_scalar< T > &  s)

获取 timestamp_scalar 的 device view。

参数
s要获取 device view 的 timestamp_scalar
返回
timestamp_scalar 的 device view

定义于文件 scalar_device_view.cuh414 行。

◆ has_nested_columns()

bool cudf::has_nested_columns ( table_view const &  table)

确定给定 table 中是否存在任何嵌套列。

参数
table输入的 table
返回
输入 table 中是否存在嵌套列

◆ has_nested_nullable_columns()

bool cudf::has_nested_nullable_columns ( table_view const &  input)

如果 table 在列层次结构的任何级别包含可空列,则返回 True。

参数
input要检查可空列的 table
返回
如果 table 在列层次结构的任何级别包含可空列则为 True,否则为 False

◆ has_nested_nulls()

bool cudf::has_nested_nulls ( table_view const &  input)

如果 table 在其列层次结构中的任何列包含 null 值,则返回 True。

参数
input要检查 null 值的 table
返回
如果 table 在其列层次结构中的任何列包含 null 值则为 True,否则为 False

◆ has_nulls()

bool cudf::has_nulls ( table_view const &  view)

如果 table 在其任何列中包含 null 值,则返回 True。

这会检查列中的 null 值,但不检查任何子列中的 null 值。

参数
view要检查 null 值的 table
返回
如果 table 在其任何列中包含 null 值则为 True,否则为 False

◆ have_same_types() [1/5]

bool cudf::have_same_types ( column_view const &  lhs,
column_view const &  rhs 
)

比较两个 column_view 的类型。

如果lhs的类型等于rhs的类型,则此函数返回true。

  • 对于定点类型,比较其 scale。
  • 对于字典类型,如果两者都不是空列,则比较 key 的类型。
  • 对于列表类型,递归比较子列的类型。
  • 对于结构体类型,按顺序比较每个 field 的类型。
  • 对于所有其他类型,比较 data_typeid
参数
lhs要比较的第一个column_view
rhs要比较的第二个column_view
返回
如果类型匹配则为 true

◆ have_same_types() [2/5]

bool cudf::have_same_types ( column_view const &  lhs,
scalar const &  rhs 
)

比较 column_viewscalar 的类型

如果lhs的类型等于rhs的类型,则此函数返回true。

  • 对于定点类型,比较其 scale。
  • 对于字典列类型,比较 key 的类型和 scalar 类型。
  • 对于列表类型,递归比较子列的类型。
  • 对于结构体类型,按顺序比较每个 field 的类型。
  • 对于所有其他类型,比较 data_typeid
参数
lhs要比较的 column_view
rhs要比较的 scalar
返回
如果类型匹配则为 true

◆ have_same_types() [3/5]

bool cudf::have_same_types ( scalar const &  lhs,
column_view const &  rhs 
)

比较 scalarcolumn_view 的类型

如果lhs的类型等于rhs的类型,则此函数返回true。

  • 对于定点类型,比较其 scale。
  • 对于字典列类型,比较 key 的类型和 scalar 类型。
  • 对于列表类型,递归比较子列的类型。
  • 对于结构体类型,按顺序比较每个 field 的类型。
  • 对于所有其他类型,比较 data_typeid
参数
lhs要比较的 scalar
rhs要比较的 column_view
返回
如果类型匹配则为 true

◆ have_same_types() [4/5]

bool cudf::have_same_types ( scalar const &  lhs,
scalar const &  rhs 
)

比较两个 scalar 的类型。

如果lhs的类型等于rhs的类型,则此函数返回true。

  • 对于定点类型,比较其 scale。
  • 对于列表类型,递归比较子列的类型。
  • 对于结构体类型,按顺序比较每个 field 的类型。
  • 对于所有其他类型,比较 data_typeid
参数
lhs第一个要比较的 scalar
rhs第二个要比较的 scalar
返回
如果类型匹配则为 true

◆ have_same_types() [5/5]

bool cudf::have_same_types ( table_view const &  lhs,
table_view const &  rhs 
)

检查两个 table_view 是否具有相同类型的列。

参数
lhs左侧 table_view 操作数
rhs右侧 table_view 操作数
返回
布尔比较结果

◆ is_runtime_jit_supported()

bool cudf::is_runtime_jit_supported ( )

根据是否支持 Runtime JIT 操作返回 true/false。

返回
如果支持 runtime JIT 则为 true,否则为 false。

◆ make_list_size_iterator()

CUDF_HOST_DEVICE auto cudf::make_list_size_iterator ( detail::lists_column_device_view const &  c)
inline

创建一个迭代器,按行索引返回列表的大小。

示例:对于一个有 3 行的 list_column_device_view,l = {[1, 2, 3], [4, 5], [6, 7, 8, 9]}

assert(it[0] == 3);
assert(it[1] == 2);
assert(it[2] == 4);
CUDF_HOST_DEVICE auto make_list_size_iterator(detail::lists_column_device_view const &c)
创建一个迭代器,按行索引返回列表的大小。
参数
c要迭代的 list_column_device_view
返回
一个按行索引返回列表大小的迭代器

定义于文件 list_device_view.cuh375 行。

◆ make_timezone_transition_table()

std::unique_ptr<table> cudf::make_timezone_transition_table ( std::optional< std::string_view >  tzif_dir,
std::string_view  timezone_name,
rmm::cuda_stream_view  stream = cudf::get_default_stream()
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
)

创建一个转换表,用于将 ORC 时间戳转换为 UTC。

使用系统的 TZif 文件。解析这些文件时假定为 little-endian 平台。转换表以 TZif 文件中的条目开始。对于文件最后一个转换之后的时间戳,表中包含构成 solar_cycle_years 年周期(未来条目)的条目。表的这一部分有 solar_cycle_entry_count 个元素,因为它假定每年有两个从夏令时转换的条目。如果时区没有 DST,表仍然会包含未来的条目,这些条目都将具有相同的 offset。

参数
tzif_dirTZif 文件所在的目录
timezone_name标准时区名称(例如,“America/Los_Angeles”)
stream用于 device memory 操作和 kernel 启动的 CUDA stream
mr用于分配返回 table 的 device memory 的 Device memory resource。
返回
给定 timezone 的转换表

◆ null_compare()

auto cudf::null_compare ( bool  lhs_is_null,
bool  rhs_is_null,
null_order  null_precedence 
)
inline

根据 null order 比较 null 值。

参数
lhs_is_null表示 lhs 是否为 null 的布尔值
rhs_is_null表示 lhs 是否为 null 的布尔值
null_precedencenull 顺序
返回
指示 lhs 和 rhs 列中 null 值之间的关系。

定义于文件 row_operators.cuh101 行。

◆ nullable()

bool cudf::nullable ( table_view const &  view)

如果 table 中的任何列是可空的,则返回 True。(不包括整个层次结构)

参数
view要检查 nullability 的 table
返回
如果 table 中的任何列是可空的则为 True,否则为 False

◆ relational_compare()

template<typename Element , std::enable_if_t< std::is_floating_point_v< Element >> * = nullptr>
weak_ordering cudf::relational_compare ( Element  lhs,
Element  rhs 
)

针对浮点 Element 类型的关系比较特化,用于推导元素相对于 lhs 的顺序。

针对非浮点 Element 类型的关系比较特化,用于推导元素相对于 lhs 的顺序。

此特化按以下顺序处理 nan[-Inf, -ve, 0, -0, +ve, +Inf, NaN, NaN, null] (对于 null_order::AFTER) [null, -Inf, -ve, 0, -0, +ve, +Inf, NaN, NaN] (对于 null_order::BEFORE)

参数
lhs第一个元素
rhs第二个元素
返回
指示 lhsrhs 列中元素之间的关系

定义于文件 row_operators.cuh80 行。

◆ scatter_columns()

table_view cudf::scatter_columns ( table_view const &  source,
std::vector< size_type > const &  map,
table_view const &  target 
)

根据列索引 map 将 table_view 中的 column_views 复制到另一个 table_view 中。

输出的 table view out_tabletarget table_view 的副本,但元素已根据 out_table[map[i]] = source[i] 进行更新,其中 i 的范围是 [0,source.size())

参数
source要 scatter 到输出 table view 中的新列的 table。
map每个新列应复制到输出中的索引。
target接收更新的 column views 的 table。
返回
新的 table_view

◆ set_allocate_host_as_pinned_threshold()

void cudf::set_allocate_host_as_pinned_threshold ( size_t  threshold)

设置将 host memory 分配为 pinned memory 的阈值大小。

参数
threshold以字节为单位的阈值大小。如果分配大小小于或等于此阈值,则将内存分配为 pinned memory。如果大小大于此阈值,则将内存分配为 pageable memory。

◆ set_kernel_pinned_copy_threshold()

void cudf::set_kernel_pinned_copy_threshold ( size_t  threshold)

设置使用 kernel 进行 pinned memory 复制的阈值大小。

参数
threshold以字节为单位的阈值大小。如果复制大小小于此阈值,将使用 kernel 进行复制。如果大小大于或等于此阈值,将使用 cudaMemcpyAsync 进行复制。

◆ set_pinned_memory_resource()

设置用于 pinned memory 分配的 rmm resource。

参数
mr用于 pinned 分配的 rmm resource
返回
之前正在使用的 resource