分位数#

pylibcudf.quantiles.quantile(Column input, vector[double] q, interpolation interp=interpolation.LINEAR, Column ordered_indices=None, bool exact=True) Column#

计算带插值的分位数。

使用 interp 中指定的插值策略,通过插值其所在值之间的值来计算指定的分位数。

详细信息请参阅 quantile()

参数:
input: Column

用于计算分位数的 Column。

q: array-like that implements buffer-protocol

要计算的分位数,范围为 [0,1]

interp: Interpolation, default Interpolation.LINEAR

用于在指定分位数附近的值之间进行选择的策略。

ordered_indices: Column, default empty column

包含输入排序顺序的 Column。

如果为空,则按现有顺序使用所有输入值。索引必须在 [0, input.size()) 范围内,但不要求唯一。此列未索引的值将被忽略。

exact: bool, default True

如果为 True,返回 double 类型。否则,返回与输入相同的类型。

详细信息请参阅 :cpp:func:`quantile`。
返回:

包含指定分位数的 Column,不可确定的值为空。

pylibcudf.quantiles.quantiles(Table input, vector[double] q, interpolation interp=interpolation.NEAREST, sorted is_input_sorted=sorted.NO, list column_order=None, list null_precedence=None) Table#

计算带插值的行分位数。

通过检索与指定分位数对应的行来计算指定的分位数。如果分位数位于行之间,则使用指定的插值策略来选择行。

详细信息请参阅 quantiles()

参数:
input: Table

用于计算行分位数的 Table。

q: array-like

要计算的分位数,范围为 [0,1]

interp: Interpolation, default Interpolation.NEAREST

用于在指定分位数附近的值之间进行选择的策略。

必须是非算术插值策略(例如 {Interpolation.HIGHER, Interpolation.LOWER, Interpolation.NEAREST} 之一)。

is_input_sorted: Sorted, default Sorted.NO

输入表是否已预排序。

column_order: list, default None

一个 Order 枚举列表,指示每列所需的排序顺序。默认情况下,所有列将按升序排序。

如果 is_input_sortedSorted.YES,则忽略。

null_precedence: list, default None

一个 NullOrder 枚举列表,指示空值应如何排序。默认情况下,所有列将按空值排在其他元素之前的方式排序。

如果 is_input_sortedSorted.YES,则忽略。

详细信息请参阅 :cpp:func:`quantiles`。
返回:

包含指定分位数的 Column,不可确定的值为空。