AggregationOverWindow
一种聚合实例,也包含列号和窗口元数据,以便可以在特定窗口上完成聚合。
|
ArrowIPCOptions
用于读取 Arrow IPC 格式数据的选项
|
ArrowIPCOptions.Builder |
ArrowIPCOptions.NeedGpu |
ArrowIPCWriterOptions
用于写入 Arrow IPC 数据设置。
|
ArrowIPCWriterOptions.Builder |
ArrowIPCWriterOptions.DoneOnGpu |
AvroOptions
用于读取 Avro 文件的选项
|
AvroOptions.Builder |
BaseDeviceMemoryBuffer
设备内存中所有 MemoryBuffer 的基类。
|
BinaryOp
数学二元运算。
|
BinaryOperable |
BufferType
ColumnVectors 和 HostColumnVectors 支持的缓冲区类型
|
CaptureGroups
捕获组设置,紧密遵循 cudf::strings::capture_groups。
|
ChunkedPack
cudf::chunked_pack 的 JNI 接口。
|
CloseableArray
包装可关闭实例数组并可关闭的实用程序类
|
ColumnFilterOptions
可过滤列的输入格式的基选项类。
|
ColumnFilterOptions.Builder |
ColumnVector
此类表示不可变的数据向量。
|
ColumnVector.EventHandler
处理此 ColumnVector 事件的接口。
|
ColumnVector.OffHeapState
保存列向量的堆外状态,即使发生泄露,我们也可以清理它。
|
ColumnView
此类表示列的 column_view,类似于其 cudf cpp 对应项。
|
ColumnView.FindOptions
用于选择 listIndexOf 函数行为的枚举:1。
|
ColumnWriterOptions
用于写入 Parquet/ORC 文件的每列设置。
|
ColumnWriterOptions.AbstractStructBuilder |
ColumnWriterOptions.ByteArrayProducer |
ColumnWriterOptions.IntArrayProducer |
ColumnWriterOptions.ListBuilder |
ColumnWriterOptions.ListColumnWriterOptions |
ColumnWriterOptions.NestedBuilder |
ColumnWriterOptions.StructBuilder |
ColumnWriterOptions.StructColumnWriterOptions |
CompressionMetadataWriterOptions |
CompressionMetadataWriterOptions.Builder |
CompressionType
压缩格式的枚举。
|
ContigSplitGroupByResult
用于保存 `Table.contiguousSplitGroupsAndGenUniqKeys` 的组和唯一键表 唯一键表中的每一行对应一个组 资源管理说明:此类拥有 `groups` 和 `uniqKeysTable`(如果表未构建,则为 uniqKeyColumns)的所有权 1:如果要立即关闭资源,请分别使用 `closeGroups` 和 `closeUniqKeyTable` 关闭资源。
|
ContiguousTable
由单个连续设备缓冲区支持的表。
|
CSVOptions
用于读取 CSV 文件的选项
|
CSVOptions.Builder |
CSVWriterOptions
用于写入 CSV 文件的选项
|
CSVWriterOptions.Builder |
Cuda.Event |
Cuda.Stream
表示 CUDA 流的类
|
CudaComputeMode
这是 CUDA 设备计算模式的 Java 映射。
|
CudaException
来自 cuda 语言/库的异常。
|
CudaException.CudaError
cudaError 的 Java 镜像,便于在 JVM 中跟踪 CUDA 错误。
|
CudaMemInfo
表示可用和总设备内存。
|
CudaMemoryBuffer
此类表示直接使用 `cudaMalloc` 分配的数据,而不是默认的 RMM 内存资源。
|
CudfException
cudf 本身抛出的异常。
|
CuFileBuffer
表示一个 cuFile 缓冲区。
|
DataSource
可用于动态向 CUDF 提供数据的基类。
|
DateTimeComponent
可提取的日期时间组件类型。
|
DateTimeRoundingFrequency |
DeviceMemoryBuffer
此类表示 GPU 上某种形式的数据。
|
DeviceMemoryBufferView
此类表示 GPU 上某种形式的数据。
|
DType |
DType.DTypeEnum |
GatherMap
此类跟踪与 gather map 相关联的数据,gather map 是一个 INT32 元素的缓冲区,可索引源表并可传递给表 gather 操作。
|
GetJsonObjectOptions |
GetJsonObjectOptions.Builder |
GroupByAggregation
可用于 reduce 的聚合。
|
GroupByAggregationOnColumn
表中特定列的 GroupByAggregation。
|
GroupByOptions
Groupby 的选项(参见 cudf::groupby::groupby 的构造函数)
|
GroupByOptions.Builder |
GroupByScanAggregation
可用于分组扫描的聚合。
|
GroupByScanAggregationOnColumn
表中特定列的 GroupByScanAggregation。
|
HashJoin
此类表示从连接操作的右侧表的连接键构建的哈希表。
|
HashType
哈希算法标识符,镜像原生枚举 cudf::hash_id
|
HostBufferConsumer
提供一组用于消费主机缓冲区的 API。
|
HostBufferProvider
提供一组用于提供要读取的主机缓冲区的 API。
|
HostColumnVector
类似于 ColumnVector,但数据存储在主机内存中,可直接从 JVM 访问。
|
HostColumnVector.Builder |
HostColumnVector.ColumnBuilder
构建
|
HostColumnVector.DataType |
HostColumnVector.EventHandler
处理此 HostColumnVector 事件的接口。
|
HostColumnVector.ListType |
HostColumnVector.StructData |
HostColumnVector.StructType |
HostColumnVectorCore
持有所属主机端 Column Vector API 和 OffHeapState 的类。
|
HostColumnVectorCore.OffHeapState
保存列向量的堆外状态,即使发生泄露,我们也可以清理它。
|
HostMemoryAllocator |
HostMemoryBuffer
此类在主机/CPU 内存中持有堆外缓冲区。
|
HostUDFWrapper
原生主机 UDF 聚合的包装器。
|
JCudfSerialization.HostConcatResult
保存主机端拼接的头部和缓冲区对结果的类
|
JCudfSerialization.SerializedColumnHeader
保存有关序列化列的元数据。
|
JCudfSerialization.SerializedTableHeader
保存有关序列化表的元数据。
|
JCudfSerialization.TableAndRowCountPair
保存反序列化表的结果。
|
JSONOptions
用于读取 JSON 编码数据的选项。
|
JSONOptions.Builder |
MemoryBuffer
表示内存缓冲区的抽象类 注意:MemoryBuffer 是公共的,以便于处理类层次结构,不建议也不支持超出 CUDF 范围的子类化。
|
MemoryBuffer.EventHandler
处理此 MemoryBuffer 事件的接口。
|
MemoryBuffer.MemoryBufferCleaner |
MemoryCleaner.Cleaner
可用于清理向量资源的 API,即使发生了泄露
|
MixedJoinSize
此类跟踪与混合表连接相关联的大小信息。
|
NaNEquality
在操作中应如何比较 NaN。
|
NullEquality
在操作中应如何比较 null。
|
NullPolicy
指定在操作中是包含 null 还是排除 null。
|
NvtxColor |
ORCOptions
用于读取 ORC 文件的选项
|
ORCOptions.Builder |
ORCWriterOptions
此类表示写入 ORC 文件的设置。
|
ORCWriterOptions.Builder |
OrderByArg
提供特定列的排序。
|
OutOfBoundsPolicy
用于处理可能的越界索引的策略 `NULLIFY` 表示将对应于越界 gather map 值的输出值设为 null。
|
PackedColumnMetadata
由单个连续设备缓冲区支持的表的元数据。
|
PadSide |
ParquetOptions
用于读取 parquet 文件的选项
|
ParquetOptions.Builder |
ParquetWriterOptions
此类表示写入 Parquet 文件的设置。
|
ParquetWriterOptions.Builder |
ParquetWriterOptions.StatisticsFrequency |
PartitionedTable
提供 PartitionedTable 的类
|
QuantileMethod
当所需分位数介于两个数据点 i 和 j 之间时使用的插值方法。
|
QuoteStyle
CSV 记录的引用样式,紧密遵循 cudf::io::quote_style。
|
ReductionAggregation
可用于 reduce 的聚合。
|
RegexFlag
正则表达式标志设置,紧密遵循 cudf::strings::regex_flags。
|
RegexProgram
正则表达式程序类,紧密遵循 cudf::strings::regex_program。
|
ReplacePolicy
指定替换值相对于空行的位置的策略。
|
ReplacePolicyWithColumn
特定列的替换策略
|
Rmm.LogConf
将 RMM 分配和释放日志发送到何处。
|
RmmDeviceMemoryResource
分配/解除分配设备内存的资源。
|
RmmEventHandler |
RmmException
来自 RMM 分配器的异常。
|
RmmTrackingResourceAdaptor
将跟踪内存使用的一些基本统计信息的设备内存资源。
|
RmmWrappingDeviceMemoryResource
包装另一个 RmmDeviceMemoryResource 的资源。
|
RollingAggregation
可用于滚动窗口的聚合。
|
RollingAggregationOnColumn
表中特定列的 RollingAggregation。
|
RoundMode
round 方法支持的舍入模式。
|
Scalar
单个标量值。
|
ScanAggregation
可用于扫描的聚合。
|
ScanType
扫描操作类型。
|
Schema
要读入的数据的模式。
|
Schema.Builder |
SegmentedReductionAggregation
可用于 reduce 的聚合。
|
StreamedTableReader
提供从单个输入源读取多个表的接口。
|
Table
表示 ColumnVectors 集合以及可对其集体执行操作的类。
|
Table.DuplicateKeepOption
用于指定将复制到输出的重复行/元素中的哪些的枚举。
|
Table.GroupByOperation
表示 groupby 操作的类
|
Table.TableOperation |
Table.TestBuilder
使用 CPU 中的数据在 GPU 上创建表。
|
TableDebug |
TableDebug.Builder |
TableDebug.Output |
TableWithMeta
一个表及其相关元数据。
|
TableWithMeta.NestedChildren |
TableWriter
提供分多步写入表信息的接口。
|
TableWriter.WriteStatistics |
UnaryOp
数学一元运算。
|
WindowOptions
滚动窗口的选项。
|
WindowOptions.Builder |