Aggregation128Utils |
在聚合期间用于拆分和重新组装 128 位值的实用方法,以启用基于哈希的聚合并检测溢出。
|
AggregationOverWindow |
一个 Aggregation 实例,也包含列号和窗口元数据,以便可以在特定窗口上执行聚合。
|
ArrowColumnBuilder |
从 Arrow 数据构建列。
|
ArrowIPCOptions |
读取 Arrow IPC 格式数据的选项
|
ArrowIPCOptions.Builder |
|
ArrowIPCWriterOptions |
写入 Arrow IPC 数据的设置。
|
ArrowIPCWriterOptions.Builder |
|
AssertEmptyNulls |
此类是一个辅助类,用于断言 ColumnView 中没有非空(non-empty)的空值。存在此类是为了通过传递 "-da:ai.rapids.cudf.AssertEmptyNulls" 在需要时开启/关闭断言。
|
AvroOptions |
读取 Avro 文件的选项
|
AvroOptions.Builder |
|
BaseDeviceMemoryBuffer |
所有位于设备内存中的 MemoryBuffer 的基类。
|
ChunkedPack |
cudf::chunked_pack 的 JNI 接口。
|
CloseableArray<T extends AutoCloseable> |
一个实用类,包装一个可关闭实例数组并且可以关闭
|
ColumnFilterOptions |
可过滤列的输入格式的基础选项类。
|
ColumnFilterOptions.Builder<T extends ColumnFilterOptions.Builder> |
|
ColumnVector |
此类表示数据的不可变向量。
|
ColumnVector.OffHeapState |
保存列向量的堆外状态,以便即使发生内存泄漏,我们也可以清理它。
|
ColumnView |
此类表示列的 column_view,类似于其 cudf cpp 对应物。
|
ColumnWriterOptions |
写入 Parquet/ORC 文件时每列的设置。
|
ColumnWriterOptions.AbstractStructBuilder<T extends ColumnWriterOptions.AbstractStructBuilder,V extends ColumnWriterOptions> |
|
ColumnWriterOptions.ListBuilder |
|
ColumnWriterOptions.ListColumnWriterOptions |
|
ColumnWriterOptions.NestedBuilder<T extends ColumnWriterOptions.NestedBuilder,V extends ColumnWriterOptions> |
|
ColumnWriterOptions.StructBuilder |
|
ColumnWriterOptions.StructColumnWriterOptions |
|
CompressionMetadataWriterOptions |
|
CompressionMetadataWriterOptions.Builder<T extends CompressionMetadataWriterOptions.Builder,V extends CompressionMetadataWriterOptions> |
|
ContigSplitGroupByResult |
用于保存 groups 和 uniq key table,供 `Table.contiguousSplitGroupsAndGenUniqKeys` 使用。uniq key table 中的每一行对应一个组。资源管理注意:此类是 `groups` 和 `uniqKeysTable`(如果表未构建,则是 uniqKeyColumns)的所有者。1:如果您想立即关闭资源,请使用 `closeGroups` 和 `closeUniqKeyTable` 分别关闭它们。
|
ContiguousTable |
一个由单个连续设备缓冲区支持的表。
|
CSVOptions |
读取 CSV 文件的选项
|
CSVOptions.Builder |
|
CSVWriterOptions |
写入 CSV 文件的选项
|
CSVWriterOptions.Builder |
|
Cuda |
|
Cuda.Event |
|
Cuda.Stream |
表示 CUDA 流的类
|
CudaMemInfo |
表示空闲和总设备内存。
|
CudaMemoryBuffer |
此类表示直接使用 `cudaMalloc` 而非默认 RMM 内存资源分配的数据。
|
Cudf |
|
CuFile |
访问 cuFile API 的 JNI 包装器。
|
CuFileBuffer |
表示一个 cuFile 缓冲区。
|
CuFileReadHandle |
表示一个用于读取的 cuFile 文件句柄。
|
CuFileWriteHandle |
表示一个用于读取的 cuFile 文件句柄。
|
DataSource |
可用于向 CUDF 动态提供数据的基类。
|
DecimalUtils |
|
DefaultHostMemoryAllocator |
|
DeviceMemoryBuffer |
此类表示 GPU 上的某种形式的数据。
|
DeviceMemoryBufferView |
此类表示 GPU 上的某种形式的数据。
|
DType |
|
GatherMap |
此类跟踪与 GatherMap 相关的数据,GatherMap 是一个 INT32 元素缓冲区,用于索引源表并可传递给表 Gather 操作。
|
GetJsonObjectOptions |
|
GetJsonObjectOptions.Builder |
|
GroupByAggregation |
可用于 Reduce 操作的聚合。
|
GroupByAggregationOnColumn |
表的特定列的 GroupByAggregation。
|
GroupByOptions |
GroupBy 选项 (参见 cudf::groupby::groupby 的构造函数)
|
GroupByOptions.Builder |
|
GroupByScanAggregation |
可用于分组 Scan 操作的聚合。
|
GroupByScanAggregationOnColumn |
表的特定列的 GroupByScanAggregation。
|
HashJoin |
此类表示为连接操作从右侧表的连接键构建的哈希表。
|
HostColumnVector |
类似于 ColumnVector,但数据存储在主机内存中,可直接从 JVM 访问。
|
HostColumnVector.BasicType |
|
HostColumnVector.Builder |
|
HostColumnVector.ColumnBuilder |
构建
|
HostColumnVector.DataType |
|
HostColumnVector.ListType |
|
HostColumnVector.StructData |
|
HostColumnVector.StructType |
|
HostColumnVectorCore |
一个包含主机端 Column Vector API 和 OffHeapState 的类。
|
HostColumnVectorCore.OffHeapState |
保存列向量的堆外状态,以便即使发生内存泄漏,我们也可以清理它。
|
HostMemoryBuffer |
此类在主机/CPU 内存中保存一个堆外缓冲区。
|
HostUDFWrapper |
原生主机 UDF 聚合的包装器。
|
JCudfSerialization |
使用自定义格式序列化和反序列化 CUDF 表和列。
|
JCudfSerialization.HostConcatResult |
用于保存主机端连接产生的头部和缓冲区对结果的类
|
JCudfSerialization.SerializedColumnHeader |
保存有关序列化列的元数据。
|
JCudfSerialization.SerializedTableHeader |
保存有关序列化表的元数据。
|
JCudfSerialization.TableAndRowCountPair |
保存反序列化表的结果。
|
JSONOptions |
读取 JSON 编码数据的选项。
|
JSONOptions.Builder |
|
MemoryBuffer |
表示 Memory Buffer 的抽象类 注意:MemoryBuffer 是公共的,以便更容易处理类层次结构,不建议且不支持超出 CUDF 范围的子类化。
|
MemoryBuffer.MemoryBufferCleaner |
|
MemoryCleaner |
ColumnVector 可能在堆外存储数据,并且由于复杂的处理,单个向量的生命周期可能差异很大。
|
MemoryCleaner.Cleaner |
即使发生内存泄漏,也可用于清理向量资源的 API
|
MixedJoinSize |
此类跟踪与混合表连接相关的尺寸信息。
|
MultiBufferDataSource |
这是一个可以接受多个 HostMemoryBuffer 的 DataSource。
|
NativeDepsLoader |
此类将加载原生依赖项。
|
NvtxRange |
此类支持 push/pop NVTX 性能分析范围或“作用域”范围。
|
NvtxUniqueRange |
此类支持 start/end NVTX 性能分析范围。
|
ORCChunkedReader |
提供以迭代方式读取 ORC 文件的接口。
|
ORCOptions |
读取 ORC 文件的选项
|
ORCOptions.Builder |
|
ORCWriterOptions |
此类表示写入 ORC 文件的设置。
|
ORCWriterOptions.Builder |
|
OrderByArg |
提供特定列的排序。
|
PackedColumnMetadata |
由单个连续设备缓冲区支持的表的元数据。
|
ParquetChunkedReader |
提供以迭代方式读取 Parquet 文件的接口。
|
ParquetOptions |
读取 Parquet 文件的选项
|
ParquetOptions.Builder |
|
ParquetWriterOptions |
此类表示写入 Parquet 文件的设置。
|
ParquetWriterOptions.Builder |
|
PartitionedTable |
提供 PartitionedTable 的类
|
PinnedMemoryPool |
这是 rmm::pool_memory_resource 的 JNI 接口.
|
Range |
用于创建范围的辅助实用程序。
|
ReductionAggregation |
可用于 Reduce 操作的聚合。
|
RegexProgram |
正则表达式程序类,紧随 cudf::strings::regex_program。
|
ReplacePolicyWithColumn |
特定列的替换策略
|
Rmm |
这是 rmm 库的绑定类。
|
Rmm.LogConf |
RMM 分配和释放日志的发送目标。
|
RmmAllocationMode |
|
RmmArenaMemoryResource<C extends RmmDeviceMemoryResource> |
一种设备内存资源,它会预分配一个资源池,并从该池中进行子分配,以提高内存性能。
|
RmmCudaAsyncMemoryResource |
一种使用 `cudaMallocAsync` 和 `cudaFreeAsync` 进行分配和释放的设备内存资源。
|
RmmCudaMemoryResource |
一种使用 `cudaMalloc` 和 `cudaFree` 进行分配和释放的设备内存资源。
|
RmmEventHandlerResourceAdaptor<C extends RmmDeviceMemoryResource> |
一种在特定情况下提供回调的设备内存资源。
|
RmmLimitingResourceAdaptor<C extends RmmDeviceMemoryResource> |
一种限制最大分配量的设备内存资源。
|
RmmLoggingResourceAdaptor<C extends RmmDeviceMemoryResource> |
一种记录交互的设备内存资源。
|
RmmManagedMemoryResource |
一种使用 `cudaMallocManaged` 和 `cudaFreeManaged` 进行分配和释放的设备内存资源。
|
RmmPoolMemoryResource<C extends RmmDeviceMemoryResource> |
一种设备内存资源,它会预分配一个资源池,并从该池中进行子分配,以提高内存性能。
|
RmmTrackingResourceAdaptor<C extends RmmDeviceMemoryResource> |
一种跟踪内存使用情况基本统计信息的设备内存资源。
|
RmmWrappingDeviceMemoryResource<C extends RmmDeviceMemoryResource> |
包装另一个 RmmDeviceMemoryResource 的资源
|
RollingAggregation |
可用于滚动窗口的聚合。
|
RollingAggregationOnColumn |
表的特定列的 RollingAggregation。
|
Scalar |
单个标量值。
|
ScanAggregation |
可用于 Scan 操作的聚合。
|
Schema |
待读入数据的模式。
|
Schema.Builder |
|
SegmentedReductionAggregation |
可用于 Reduce 操作的聚合。
|
Table |
表示 ColumnVector 集合及其可集体执行操作的类。
|
Table.GroupByOperation |
表示 GroupBy 操作的类
|
Table.TableOperation |
|
Table.TestBuilder |
使用 CPU 数据在 GPU 上创建表。
|
TableDebug |
|
TableDebug.Builder |
|
TableWithMeta |
表及其一些元数据。
|
TableWithMeta.NestedChildren |
|
TableWriter |
提供分步写入表信息的接口。
|
TableWriter.WriteStatistics |
|
WindowOptions |
滚动窗口的选项。
|
WindowOptions.Builder |
|