tdigest#

group tdigest API
class tdigest_column_view : private cudf::column_view#
#include <tdigest_column_view.hpp>

给定一个包含 tdigest 数据的 column_view,此类的实例为 tdigest 操作提供复合列上的包装器。

tdigest 是一组“压缩”的输入标量,表示为一组排序的质心 (https://arxiv.org/pdf/1902.04023.pdf)。此数据可用于查询分位数信息。tdigest 列中的每一行代表一个完整的 tdigest。

该列具有以下结构

struct { // tdigest 的质心 list { struct { double // mean double // weight } } // 这些来自输入流,而不是质心。它们用于 // 在计算近似百分位数时靠近分位数开头或 // 结尾的部分 double // min double // max }

公共类型

using offset_iterator = size_type const*#

偏移量的迭代器。

公共函数

tdigest_column_view(column_view const&)#

column_view 构造 tdigest_column_view

tdigest_column_view(tdigest_column_view&&) = default#

移动构造函数。

tdigest_column_view(tdigest_column_view const&) = default#

复制构造函数。

tdigest_column_view &operator=(tdigest_column_view const&) = default#

复制赋值运算符。

返回:

复制其他对象内容后的此对象(复制)

tdigest_column_view &operator=(tdigest_column_view&&) = default#

移动赋值运算符。

返回:

移动其他对象内容后的此对象(转移所有权)

column_view parent() const#

返回父列。

返回:

父列

lists_column_view centroids() const#

返回质心列。

返回:

质心的列表列

column_view means() const#

返回均值的内部列。

返回:

均值的内部列

column_view weights() const#

返回权重的内部列。

返回:

权重的内部列

double const *min_begin() const#

返回该列的第一个最小值。每一行对应于相应的 tdigest 的最小值。

返回:

指向该列第一个最小值的 const 指针

double const *max_begin() const#

返回该列的第一个最大值。每一行对应于相应的 tdigest 的最大值。

返回:

指向该列第一个最大值的 const 指针

公共静态属性

static constexpr size_type mean_column_index = {0}#

均值列索引。

static constexpr size_type weight_column_index = {1}#

权重列索引。

static constexpr size_type centroid_column_index = {0}#

质心列索引。

static constexpr size_type min_column_index = {1}#

最小值列索引。

static constexpr size_type max_column_index = {2}#

最大值列索引。