DataFrame#
构造函数#
|
一个 GPU Dataframe 对象。 |
属性和底层数据#
轴
返回一个表示 DataFrame 轴的列表。 |
|
获取行的标签。 |
|
返回一个列的元组 |
返回此对象中的数据类型 (dtypes)。 |
|
|
打印 DataFrame 的简洁摘要。 |
|
根据列的数据类型返回 DataFrame 列的子集。 |
返回 DataFrame 的 CuPy 表示。 |
|
数据的维度。 |
|
返回底层数据中的元素数量。 |
|
返回表示 DataFrame 维度的元组。 |
|
|
返回对象的内存使用量。 |
指示 DataFrame 或 Series 是否为空。 |
转换#
|
将对象转换为给定的数据类型 (dtype)。 |
|
将列转换为最优的可空数据类型 (nullable dtypes)。 |
|
创建此对象的索引和数据的副本。 |
索引,迭代#
|
返回前 n 行。 |
DataFrame.loc 的别名;为了与 Pandas 兼容而提供。 |
|
DataFrame.iloc 的别名;为了与 Pandas 兼容而提供。 |
|
按标签或布尔掩码选择行和列。 |
|
按位置选择值。 |
|
|
在 loc 指定的索引处向 DataFrame 添加一列。 |
迭代列名和 Series 对 |
|
获取列。 |
|
不支持迭代。 |
|
|
不支持迭代。 |
|
返回一列并从 DataFrame 中删除。 |
|
返回最后 n 行作为新的 DataFrame 或 Series |
|
DataFrame 中的每个元素是否包含在 values 中。 |
|
将一维轴对象压缩为标量。 |
|
替换条件为 False 的值。 |
|
替换条件为 True 的值。 |
|
使用布尔表达式进行查询,利用 Numba 编译 GPU 内核。 |
二元运算符函数#
|
获取 DataFrame 或 Series 与 other 的逐元素相加结果(二元运算符 add)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相减结果(二元运算符 sub)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相减结果(二元运算符 sub)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相乘结果(二元运算符 mul)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相乘结果(二元运算符 mul)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点相除结果(二元运算符 truediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点相除结果(二元运算符 truediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点相除结果(二元运算符 truediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素整数相除结果(二元运算符 floordiv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素取模结果(二元运算符 mod)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素指数结果(二元运算符 pow)。 |
|
获取 frame 与 other 的点积(二元运算符 dot)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相加结果(二元运算符 radd)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相减结果(二元运算符 rsub)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相乘结果(二元运算符 rmul)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点相除结果(二元运算符 rtruediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点相除结果(二元运算符 rtruediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素整数相除结果(二元运算符 rfloordiv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素取模结果(二元运算符 rmod)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素指数结果(二元运算符 rpow)。 |
|
四舍五入到可变的小数位数。 |
|
获取 DataFrame 或 Series 与 other 的逐元素小于结果(二元运算符 lt)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素大于结果(二元运算符 gt)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素小于或等于结果(二元运算符 le)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素大于或等于结果(二元运算符 ge)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素不等于结果(二元运算符 ne)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素等于结果(二元运算符 eq)。 |
|
返回 DataFrame 中值的乘积。 |
函数应用,GroupBy 和 窗口#
|
使用一个或多个操作沿指定轴进行聚合。 |
|
沿 DataFrame 的轴应用函数。 |
|
逐元素地将函数应用于 Dataframe。 |
|
使用用户提供的函数转换用户指定的块。 |
|
应用一个行级别的用户定义函数。 |
|
使用映射器或通过列的 Series 进行分组。 |
|
逐元素地将函数应用于 Dataframe。 |
|
应用 |
|
滚动窗口计算。 |
计算 / 描述性统计#
返回一个 Series/DataFrame,其中包含每个元素的绝对数值。 |
|
|
返回 DataFrame 中是否所有元素都为 True。 |
|
返回 DataFrame 中是否任何元素为 True。 |
|
在输入阈值处修剪值。 |
|
计算 DataFrame 的相关矩阵。 |
|
计算每列或每行中 |
|
计算 DataFrame 的协方差矩阵。 |
|
返回 IndexedFrame 的累积最大值。 |
|
返回 IndexedFrame 的累积最小值。 |
|
返回 IndexedFrame 的累积乘积。 |
|
返回 IndexedFrame 的累积总和。 |
|
生成描述性统计信息。 |
|
元素的第一个离散差分。 |
|
评估描述 DataFrame 列操作的字符串。 |
|
提供指数加权 (EW) 函数。 |
|
返回样本的 Fisher 无偏峰度。 |
|
返回样本的 Fisher 无偏峰度。 |
|
返回 DataFrame 中的最大值。 |
|
返回请求轴的值的平均值。 |
|
返回请求轴的值的中位数。 |
|
返回 DataFrame 中的最小值。 |
|
获取沿选定轴的每个元素的众数。 |
|
计算 DataFrame 中连续元素之间的百分比变化。 |
|
返回 DataFrame 中值的乘积。 |
|
返回 DataFrame 中值的乘积。 |
|
返回给定分位数处的值。 |
|
计算沿轴的数值数据排名(1 到 n)。 |
|
四舍五入到可变的小数位数。 |
将值缩放到 float64 中的 [0, 1] 范围 |
|
|
返回样本的 Fisher-Pearson 无偏偏度。 |
|
返回 DataFrame 中值的总和。 |
|
返回 DataFrame 的样本标准差。 |
|
返回 DataFrame 的无偏方差。 |
|
计算指定轴中不同元素的数量。 |
|
返回一个包含 DataFrame 中唯一行计数的 Series。 |
重新索引 / 选择 / 标签操作#
|
为标签添加字符串前缀 prefix。 |
|
为标签添加字符串后缀 suffix。 |
|
从行或列中删除指定的标签。 |
|
返回已删除重复行的 DataFrame。 |
|
返回指示重复行的布尔 Series。 |
|
测试两个对象是否包含相同的元素。 |
|
根据日期偏移量选择时间序列数据的初始周期。 |
|
返回前 n 行。 |
|
根据日期偏移量选择时间序列数据的最终周期。 |
|
使 DataFrame 符合新的索引。 |
|
更改列和索引标签。 |
|
重置 DataFrame 的索引或其级别。 |
|
返回对象轴上的项目随机样本。 |
|
查找应该插入元素以保持顺序的索引 |
|
返回一个带有新索引的新 DataFrame |
|
连续重复元素。 |
|
返回最后 n 行作为新的 DataFrame 或 Series |
|
返回包含由 indices 指定的行的新帧。 |
|
将行重复 count 次以形成新帧。 |
|
截断 Series 或 DataFrame 在某个索引值之前和之后的部分。 |
缺失数据处理#
|
是 |
|
是 |
|
从列中删除包含 null 的行(或列)。 |
|
是 |
|
使用 |
|
在某些点之间插值数据值。 |
识别缺失值。 |
|
识别缺失值。 |
|
将 nans(如果存在)转换为 nulls |
|
识别非缺失值。 |
|
识别非缺失值。 |
|
|
是 |
|
将 |
重塑,排序,转置#
|
返回可以对 Series 值进行排序的整数索引。 |
将表的 Series 列交叉合并到单个列中。 |
|
|
根据 columns 中数据的哈希值对 DataFrame 进行分区。 |
|
返回根据给定索引和列值组织的重塑 DataFrame。 |
|
创建一个电子表格风格的透视表作为 DataFrame。 |
|
分散到 DataFrame 列表中。 |
|
沿任一轴按值排序。 |
|
按标签(沿轴)对对象进行排序。 |
|
返回按 columns 降序排列的前 n 行。 |
|
返回按 columns 升序排列的前 n 行。 |
|
交换级别 i 和级别 j。 |
|
将指定级别从列堆叠到索引 |
|
透视(必然是分层的)索引标签的一个或多个级别。 |
|
将 DataFrame 从宽格式转换为长格式,可选地保留标识符变量。 |
|
将列表状的每个元素转换为一行,复制索引值。 |
|
返回由 DataFrame 列组成的结构体 Series。 |
转置索引和列。 |
|
转置索引和列。 |
组合 / 比较 / 连接 / 合并#
|
从关键字参数为 DataFrame 分配列。 |
|
将列与另一个 DataFrame 按索引或键列连接。 |
|
通过按列或索引执行数据库风格的连接操作来合并 GPU DataFrame 对象。 |
|
使用另一个 DataFrame 中的非 NA 值就地修改 DataFrame。 |
序列化 / IO / 转换#
|
从序列化表示生成对象。 |
|
执行设备侧的解序列化任务。 |
序列化与设备内存相关的数据和元数据。 |
|
|
从 PyArrow Table 转换为 DataFrame。 |
|
从类似数组或字典的字典构造 DataFrame。 |
|
从 Pandas DataFrame 转换。 |
|
将结构化或记录型 ndarray 转换为 DataFrame。 |
|
计算此列中值的哈希值。 |
|
执行设备侧的解序列化任务。 |
序列化与主机内存相关的数据和元数据。 |
|
生成对象的等效可序列化表示。 |
|
|
转换为 PyArrow Table。 |
|
将 DataFrame 转换为字典。 |
将 cuDF 对象转换为 DLPack 张量。 |
|
|
将 DataFrame 写入 parquet 格式。 |
|
将 DataFrame 写入 csv 文件格式。 |
|
将 Frame 转换为 CuPy 数组。 |
|
使用 HDFStore 将包含的数据写入 HDF5 文件。 |
|
将 DataFrame 转换为字典。 |
|
将 cuDF 对象转换为 JSON 字符串。 |
|
将 Frame 转换为 NumPy 数组。 |
|
转换为 Pandas DataFrame。 |
|
将 DataFrame 写入 feather 格式。 |
|
转换为 numpy recarray |
转换为字符串 |
|
返回 DataFrame 的 CuPy 表示。 |
|
返回数据的 NumPy 表示。 |
|
|
将此 DataFrame 转换为 pylibcudf.Table。 |
|
从 pylibcudf.Table 创建 DataFrame。 |