public abstract class BatchedDecompressor extends Object
构造方法和说明 |
---|
BatchedDecompressor(long chunkSize)
构造一个批处理解压缩器实例
|
修饰符和类型 | 方法和说明 |
---|---|
protected abstract void |
batchedDecompressAsync(long devInPtrs, long devInSizes, long devOutSizes, long batchSize, long tempPtr, long tempSize, long devOutPtrs, long stream)
异步解压缩一批压缩数据缓冲区。
|
protected abstract long |
batchedDecompressGetTempSize(long numChunks, long maxUncompressedChunkBytes)
计算解压缩压缩批次所需的临时存储空间大小(以字节为单位)。
|
void |
BaseDeviceMemoryBuffer[] origInputs, BaseDeviceMemoryBuffer[] outputs, Cuda.Stream stream)
异步解压缩一批缓冲区
|
public BatchedDecompressor(long chunkSize)
chunkSize
- 最大未压缩块大小,必须与压缩时使用的值匹配public void decompressAsync(BaseDeviceMemoryBuffer[] origInputs, BaseDeviceMemoryBuffer[] outputs, Cuda.Stream stream)
origInputs
- 要解压缩的缓冲区,将在此操作中关闭outputs
- 将包含解压缩结果的输出缓冲区,每个缓冲区的大小必须与相应的输入解压缩后的大小完全一致stream
- 要使用的 CUDA 流protected abstract long batchedDecompressGetTempSize(long numChunks, long maxUncompressedChunkBytes)
numChunks
- 批次中的块数maxUncompressedChunkBytes
- 任何块的最大未压缩大小(以字节为单位)protected abstract void batchedDecompressAsync(long devInPtrs, long devInSizes, long devOutSizes, long batchSize, long tempPtr, long tempSize, long devOutPtrs, long stream)
devInPtrs
- 压缩输入缓冲区地址向量的设备地址devInSizes
- 压缩输入缓冲区大小向量的设备地址devOutSizes
- 未压缩缓冲区大小向量的设备地址batchSize
- 批次中的缓冲区数量tempPtr
- 临时解压缩空间的设备地址tempSize
- 临时解压缩空间的大小(以字节为单位)devOutPtrs
- 未压缩输出缓冲区地址向量的设备地址stream
- 要使用的 CUDA 流Copyright © 2025. 保留所有权利。