cuDF 用户指南#
- API 参考
- cuDF 和 Dask cuDF 十分钟快速入门
- cuDF 和 Pandas 的比较
- 支持的数据类型
- 输入/输出
- 处理缺失数据
- GroupBy
- cuDF 用户自定义函数概述
- cuDF 和 CuPy 之间的互操作性
- 选项
- 性能比较
- Pandas 兼容性注意事项
- 写时复制
- 内存分析
- cuDF 24.04+ 中对 pandas 2 的重大变更
- 移除
DataFrame.append和Series.append,请改用cudf.concat。 - 移除各种数值
Index子类,请改用cudf.Index - 按位运算结果的变化
- ufuncs 将执行重新索引
DataFrame与Series比较需要索引匹配- Series.rank
- Value counts 将结果名称设置为
count/proportion DataFrame.describe默认将包含日期时间数据- 不允许将带有
Z的日期时间字符串转换为时区无关的数据类型。 Datetime和Timedelta的归约操作将保留其时间分辨率。get_dummies默认返回类型从int8变更为bool- 当
name=None时,reset_index将列命名为None - 修复了持续时间分量计算不正确的问题
- 对
datetime/timedelta执行fillna并使用较低分辨率的标量时,现在将对 Series 进行类型转换 Groupby.nth和Groupby.dtypes的结果将包含分组列
- 移除