pylibcudf 文档#
pylibcudf 是 libcudf 的轻量级 Cython 接口,为 Python 中的 GPU 加速数据处理提供接近零的开销。它旨在为 C++ libcudf 库提供最小开销的接口,同时与 __cuda_array_interface__
等社区协议以及 CuPy 和 Numba 等常用库无缝集成。我们的零代码 pandas 加速器 (cudf.pandas
) 和我们的 polars GPU 执行引擎 (cudf.polars
) 都构建在 pylibcudf 之上。
示例:从 Parquet 文件读取数据
pylibcudf
import pylibcudf as plc
source = plc.io.SourceInfo(["dataset.parquet"])
options = plc.io.parquet.ParquetReaderOptions.builder(source).build()
table = plc.io.parquet.read_parquet(options)
libcudf
#include <cudf/io/parquet.hpp>
int main()
{
auto source = cudf::io::source_info("dataset.parquet");
auto options = cudf::io::parquet_reader_options::builder(source).build();
auto table = cudf::io::read_parquet(options);
}