分位数#
- pylibcudf.quantiles.quantile(Column input, vector[double] q, interpolation interp=interpolation.LINEAR, Column ordered_indices=None, bool exact=True) Column #
计算带插值的分位数。
使用 interp 中指定的插值策略,通过插值其所在值之间的值来计算指定的分位数。
详细信息请参阅
quantile()
。- 参数:
- input: Column
用于计算分位数的 Column。
- q: array-like that implements buffer-protocol
要计算的分位数,范围为 [0,1]
- interp: Interpolation, default Interpolation.LINEAR
用于在指定分位数附近的值之间进行选择的策略。
- ordered_indices: Column, default empty column
包含输入排序顺序的 Column。
如果为空,则按现有顺序使用所有输入值。索引必须在 [0, input.size()) 范围内,但不要求唯一。此列未索引的值将被忽略。
- exact: bool, default True
如果为 True,返回 double 类型。否则,返回与输入相同的类型。
- 详细信息请参阅 :cpp:func:`quantile`。
- 返回:
- 列
包含指定分位数的 Column,不可确定的值为空。
- pylibcudf.quantiles.quantiles(Table input, vector[double] q, interpolation interp=interpolation.NEAREST, sorted is_input_sorted=sorted.NO, list column_order=None, list null_precedence=None) Table #
计算带插值的行分位数。
通过检索与指定分位数对应的行来计算指定的分位数。如果分位数位于行之间,则使用指定的插值策略来选择行。
详细信息请参阅
quantiles()
。- 参数:
- input: Table
用于计算行分位数的 Table。
- q: array-like
要计算的分位数,范围为 [0,1]
- interp: Interpolation, default Interpolation.NEAREST
用于在指定分位数附近的值之间进行选择的策略。
必须是非算术插值策略(例如 {Interpolation.HIGHER, Interpolation.LOWER, Interpolation.NEAREST} 之一)。
- is_input_sorted: Sorted, default Sorted.NO
输入表是否已预排序。
- column_order: list, default None
一个 Order 枚举列表,指示每列所需的排序顺序。默认情况下,所有列将按升序排序。
如果 is_input_sorted 为 Sorted.YES,则忽略。
- null_precedence: list, default None
一个 NullOrder 枚举列表,指示空值应如何排序。默认情况下,所有列将按空值排在其他元素之前的方式排序。
如果 is_input_sorted 为 Sorted.YES,则忽略。
- 详细信息请参阅 :cpp:func:`quantiles`。
- 返回:
- 列
包含指定分位数的 Column,不可确定的值为空。