通用函数#

数据操作#

concat(objs[, axis, join, ignore_index, ...])

按行拼接 DataFrame、Series 或 Index。

crosstab(index, columns[, values, rownames, ...])

计算两个(或多个)因子的简单交叉表。

cut(x, bins[, right, labels, retbins, ...])

将值分箱到离散区间中。

factorize(values[, sort, use_na_sentinel, ...])

将输入值编码为整数标签

get_dummies(data[, prefix, prefix_sep, ...])

返回一个 DataFrame,其列是 df 中所有列的独热编码

melt(frame[, id_vars, value_vars, var_name, ...])

将 DataFrame 从宽格式转换为长格式,可选地保留标识符变量的设置。

merge(left, right, *args, **kwargs)

通过按列或索引执行数据库风格的连接操作来合并 GPU DataFrame 对象。

pivot(data[, columns, index, values])

返回按给定索引和列值组织的重塑后的 DataFrame。

pivot_table(data[, values, index, columns, ...])

创建电子表格风格的透视表作为 DataFrame。

unstack(df, level[, fill_value, sort])

透视(必须是层次化的)索引标签的一个或多个级别。

顶层转换#

to_numeric(arg[, errors, downcast, ...])

将参数转换为数值类型。

from_dlpack(pycapsule_obj)

将 DLPack 张量转换为 cuDF 对象。

from_pandas(obj[, nan_as_null])

将某些 Pandas 对象转换为等价的 cudf 对象。

顶层日期时间相关数据处理#

to_datetime(arg[, errors, dayfirst, ...])

将参数转换为日期时间。

date_range([start, end, periods, freq, tz, ...])

返回一个固定频率的 DatetimeIndex。

顶层区间数据处理#

interval_range([start, end, periods, freq, ...])

返回一个固定频率的 IntervalIndex。