安装#

Conda#

有关安装 RAPIDS 和 cuxfilter 的最定制化方法,请访问 RAPIDS 安装页面上的选择器。

# for CUDA 12
conda install -c rapidsai -c conda-forge -c nvidia \
    cuxfilter=25.04 python=3.10 cuda-version=12.8

# for CUDA 11
conda install -c rapidsai -c conda-forge -c nvidia \
    cuxfilter=25.04 python=3.10 cuda-version=11.8

PyPI#

使用 pip 从 PyPI 安装 cuxfilter

# for CUDA 12
pip install cuxfilter-cu12 -extra-index-url=https://pypi.nvidia.com

# for CUDA 11
pip install cuxfilter-cu11 -extra-index-url=https://pypi.nvidia.com

Docker 容器#

有关安装 RAPIDS 和 cuxfilter 的最定制化方法,请访问 RAPIDS 安装页面上的选择器。

cuxfilter docker 示例安装,适用于 cuda 12.0, ubuntu 20.04

# ex. for CUDA 11.8
docker pull rapidsai/rapidsai:cuda12.0-runtime-ubuntu20.04
docker run --gpus all --rm -it -p 8888:8888 -p 8787:8787 -p 8786:8786 \
    rapidsai/rapidsai:cuda11.8-runtime-ubuntu20.04

# open http://localhost:8888

从源代码构建/安装#

请参阅我们的 GitHub 上的构建说明

故障排除#

如果以下指南未能帮助您解决问题,请在我们的 GitHub 上提交问题

安装 jupyterlab 依赖项#

如果您在 jupyterlab notebook 中遇到图表无法渲染的问题,请确保您的环境中已安装以下依赖项

conda install -c conda-forge jupyterlab
jupyter labextension install @pyviz/jupyterlab_pyviz
jupyter labextension install @bokeh/jupyter_bokeh

下载数据集#

1. 自动下载数据集#

python/notebooks 目录下的 notebook 中已经包含一个检查函数,用于验证示例数据集是否已下载,如果不存在则下载。

2. 手动下载#

在您希望保存数据集的目录中,执行以下命令

#go the the environment where cuxfilter is installed. Skip if in a docker container
conda activate test_env

#download and extract the datasets
curl https://s3.amazonaws.com/nyc-tlc/trip+data/yellow_tripdata_2015-01.csv --create-dirs -o ./nyc_taxi.csv
curl https://data.rapids.ai/viz-data/146M_predictions_v2.arrow.gz --create-dirs -o ./146M_predictions_v2.arrow.gz
curl https://data.rapids.ai/viz-data/auto_accidents.arrow.gz --create-dirs -o ./auto_accidents.arrow.gz

python -c "from cuxfilter.sampledata import datasets_check; datasets_check(base_dir='./')"