cuDF 用户指南#
- API 参考
- cuDF 和 Dask cuDF 十分钟快速入门
- cuDF 和 Pandas 的比较
- 支持的数据类型
- 输入/输出
- 处理缺失数据
- GroupBy
- cuDF 用户自定义函数概述
- cuDF 和 CuPy 之间的互操作性
- 选项
- 性能比较
- Pandas 兼容性注意事项
- 写时复制
- 内存分析
- cuDF 24.04+ 中对 pandas 2 的重大变更
- 移除
DataFrame.append
和Series.append
,请改用cudf.concat
。 - 移除各种数值
Index
子类,请改用cudf.Index
- 按位运算结果的变化
- ufuncs 将执行重新索引
DataFrame
与Series
比较需要索引匹配- Series.rank
- Value counts 将结果名称设置为
count
/proportion
DataFrame.describe
默认将包含日期时间数据- 不允许将带有
Z
的日期时间字符串转换为时区无关的数据类型。 Datetime
和Timedelta
的归约操作将保留其时间分辨率。get_dummies
默认返回类型从int8
变更为bool
- 当
name=None
时,reset_index
将列命名为None
- 修复了持续时间分量计算不正确的问题
- 对
datetime
/timedelta
执行fillna
并使用较低分辨率的标量时,现在将对 Series 进行类型转换 Groupby.nth
和Groupby.dtypes
的结果将包含分组列
- 移除