public final class GroupByAggregation extends Object
修饰符和类型 | 方法和说明 |
---|---|
static GroupByAggregation |
argMax()
最大元素的索引。
|
static GroupByAggregation |
argMin()
最小元素的索引。
|
static GroupByAggregation |
collectList()
将值收集到列表中。
|
static GroupByAggregation |
collectList(NullPolicy nullPolicy)
将值收集到列表中。
|
static GroupByAggregation |
collectSet()
将值收集到集合中。
|
static GroupByAggregation |
collectSet(NullPolicy nullPolicy, NullEquality nullEquality, NaNEquality nanEquality)
将值收集到集合中。
|
static GroupByAggregation |
count()
计算有效元素的数量,即
|
static GroupByAggregation |
count(NullPolicy nullPolicy)
计算元素的数量。
|
static GroupByAggregation |
createTDigest(int delta)
根据固定宽度数字输入列计算 t-digest。
|
boolean |
equals(Object other) |
int |
hashCode() |
static GroupByAggregation |
histogram()
直方图聚合,计算每行的频率。
|
static GroupByAggregation |
hostUDF(HostUDFWrapper wrapper)
使用主机端用户定义函数 (UDF) 执行聚合。
|
static GroupByAggregation |
M2()
与平均值之差的平方和。
|
static GroupByAggregation |
max()
最大值聚合
|
static GroupByAggregation |
mean()
算术平均归约。
|
static GroupByAggregation |
median()
中位数归约。
|
static GroupByAggregation |
mergeHistogram()
MergeHistogram 聚合,用于合并多个直方图。
|
static GroupByAggregation |
mergeLists()
合并由多个 CollectListAggregations 产生的部分列表。
|
static GroupByAggregation |
mergeM2()
合并由多个 M2Aggregation 实例产生的部分 M2 值。
|
static GroupByAggregation |
mergeSets()
合并由多个 CollectSetAggregations 产生的部分集合。
|
static GroupByAggregation |
mergeSets(NullEquality nullEquality, NaNEquality nanEquality)
合并由多个 CollectSetAggregations 产生的部分集合。
|
static GroupByAggregation |
mergeTDigest(int delta)
合并 t-digests。
|
static GroupByAggregation |
min()
最小值聚合
|
static GroupByAggregation |
nth(int offset)
获取组中第 n 个非空元素。
|
static GroupByAggregation |
nth(int offset, NullPolicy nullPolicy)
获取组中第 n 个元素。
|
static GroupByAggregation |
nunique()
唯一非空元素的数量。
|
static GroupByAggregation |
nunique(NullPolicy nullPolicy)
唯一元素的数量。
|
GroupByAggregationOnColumn |
onColumn(int columnIndex)
将列添加到聚合中,以便可以在特定的数据列上使用它。
|
static GroupByAggregation |
product()
乘积聚合。
|
static GroupByAggregation |
quantile(double... quantiles)
聚合计算指定的分位数。
|
static GroupByAggregation |
quantile(QuantileMethod method, double... quantiles)
聚合计算各种分位数。
|
static GroupByAggregation |
standardDeviation()
自由度偏差为 1 的标准差聚合。
|
static GroupByAggregation |
standardDeviation(int ddof)
标准差聚合。
|
static GroupByAggregation |
sum()
求和聚合
|
static GroupByAggregation |
variance()
自由度偏差为 1 的方差聚合。
|
static GroupByAggregation |
variance(int ddof)
方差聚合。
|
public GroupByAggregationOnColumn onColumn(int columnIndex)
columnIndex
- 要操作的列的索引。public static GroupByAggregation count()
public static GroupByAggregation count(NullPolicy nullPolicy)
nullPolicy
- 如果应计算 null 值,则为 INCLUDE。如果仅计算非 null 值,则为 EXCLUDE。public static GroupByAggregation sum()
public static GroupByAggregation product()
public static GroupByAggregation argMax()
public static GroupByAggregation argMin()
public static GroupByAggregation min()
public static GroupByAggregation max()
public static GroupByAggregation mean()
public static GroupByAggregation M2()
public static GroupByAggregation variance()
public static GroupByAggregation variance(int ddof)
ddof
- 自由度偏差。用于计算方差的除数是 N - ddof
,其中 N 是总体大小。public static GroupByAggregation standardDeviation()
public static GroupByAggregation standardDeviation(int ddof)
ddof
- 自由度偏差。用于计算 std 的除数是 N - ddof
,其中 N 是总体大小。public static GroupByAggregation quantile(double... quantiles)
public static GroupByAggregation quantile(QuantileMethod method, double... quantiles)
public static GroupByAggregation median()
public static GroupByAggregation nunique()
public static GroupByAggregation nunique(NullPolicy nullPolicy)
nullPolicy
- 如果应计算 null 值,则为 INCLUDE,否则为 EXCLUDE。如果计算 null 值,它们被视为相等,因此范围内的多个 null 值总计只会使计数增加 1。public static GroupByAggregation nth(int offset)
offset
- 要查看的偏移量。负数从组的末尾开始计算。任何超出组范围的值都会导致 null。public static GroupByAggregation nth(int offset, NullPolicy nullPolicy)
offset
- 要查看的偏移量。负数从组的末尾开始计算。任何超出组范围的值都会导致 null。nullPolicy
- 如果 null 值应包含在聚合中,则为 INCLUDE;如果应跳过它们,则为 EXCLUDE。public static GroupByAggregation collectList()
public static GroupByAggregation collectList(NullPolicy nullPolicy)
nullPolicy
- 指示在收集过程中是否包含/排除 null 值。public static GroupByAggregation collectSet()
public static GroupByAggregation collectSet(NullPolicy nullPolicy, NullEquality nullEquality, NaNEquality nanEquality)
nullPolicy
- 指示在收集过程中是否包含/排除 null 值。nullEquality
- 标志,用于指定每个列表中的 null 条目是否应被视为相等。nanEquality
- 标志,用于指定浮点列中的 NaN 值是否应被视为相等。public static GroupByAggregation mergeLists()
public static GroupByAggregation mergeSets()
public static GroupByAggregation hostUDF(HostUDFWrapper wrapper)
wrapper
- 原生主机 UDF 实例的包装器。public static GroupByAggregation mergeSets(NullEquality nullEquality, NaNEquality nanEquality)
nullEquality
- 标志,用于指定每个列表中的 null 条目是否应被视为相等。nanEquality
- 标志,用于指定浮点列中的 NaN 值是否应被视为相等。public static GroupByAggregation mergeM2()
public static GroupByAggregation createTDigest(int delta)
delta
- 所需精度(桶的数量)。public static GroupByAggregation mergeTDigest(int delta)
delta
- 所需精度(桶的数量)。public static GroupByAggregation histogram()
public static GroupByAggregation mergeHistogram()
版权所有 © 2025。保留所有权利。