GroupBy#
GroupBy 对象由 groupby 调用返回:cudf.DataFrame.groupby()
、cudf.Series.groupby()
等。
索引,迭代#
返回一个字典,将组键映射到行标签。 |
|
函数应用#
|
对分组后的块应用 Python 转换函数。 |
|
对组应用聚合操作。 |
|
对组应用聚合操作。 |
|
对组应用聚合操作。 |
|
将带有参数的函数 func 应用于此 GroupBy 对象,并返回函数结果。 |
|
应用一个聚合操作,然后将结果广播到组的大小。 |
计算 / 描述性统计#
|
向后填充 NA 值。 |
|
计算每列的值的数量。 |
|
返回每个组中键的累积计数。 |
|
计算每个组的累积最大值。 |
|
计算每个组的累积最小值。 |
|
计算每个组的累积和。 |
|
获取每个组中值之间的差。 |
|
向前填充 NA 值。 |
|
计算组中第一个值。 |
|
从具有指定名称的组构建 DataFrame。 |
返回一个字典,将组键映射到行标签。 |
|
|
计算组中值的 idxmax。 |
|
计算组中值的 idxmin。 |
|
计算组中最后一个值。 |
|
计算组中最大值。 |
|
计算组中平均值。 |
|
计算组中中位数。 |
|
计算组中最小值。 |
|
对每个组从 0 到 组数-1 进行编号。 |
|
返回每个组中的第 n 行。 |
|
返回组中唯一元素的数量。 |
|
计算组中值的乘积。 |
|
将每个组按 |
返回每个组的大小。 |
|
|
计算每个组中值的列标准差。 |
|
计算组中值的和。 |
|
计算每个组中值的列方差。 |
|
计算 DataFrame 列之间的成对协方差,不包括 NA/null 值。 |
以下方法在 SeriesGroupBy
和 DataFrameGroupBy
对象中都可用,但可能略有不同,通常体现在 DataFrameGroupBy 版本通常允许指定轴参数,并且通常允许指定参数以指示是否将应用限制在特定数据类型的列。
|
向后填充 NA 值。 |
|
计算列的成对相关性,不包括 NA/null 值。 |
|
计算每列的值的数量。 |
|
返回每个组中键的累积计数。 |
|
计算每个组的累积最大值。 |
|
计算每个组的累积最小值。 |
|
计算每个组的累积和。 |
|
生成描述性统计信息,总结数据集分布的集中趋势、离散度和形状,不包括 NaN 值。 |
|
获取每个组中值之间的差。 |
|
向前填充 NA 值。 |
|
使用指定的方法填充 NA 值。 |
|
计算组中值的 idxmax。 |
|
计算组中值的 idxmin。 |
|
返回组中唯一元素的数量。 |
|
计算每个组中值的列分位数。 |
|
将每个组按 |
返回每个组的大小。 |
以下方法仅适用于 SeriesGroupBy
对象。
|
|
|
返回组中唯一元素的数量。 |
获取每个组中每列的唯一值列表。 |