列表#

pylibcudf.lists.ConcatenateNullPolicy#

另请参阅 cudf::concatenate_null_policy。

枚举成员

IGNORE
NULLIFY_OUTPUT_ROW

pylibcudf.lists.DuplicateFindOption#

另请参阅 cudf::duplicate_find_option。

枚举成员

FIND_FIRST
FIND_LAST

pylibcudf.lists.apply_boolean_mask(Column input, Column boolean_mask) → Column#

使用布尔掩码过滤输入列表列中每行的元素

详细信息，请参阅 apply_boolean_mask()。

参数:

inputColumn: 输入列。
boolean_maskColumn: 布尔掩码。

返回:

Column: 一个根据布尔掩码过滤元素的 Column。

pylibcudf.lists.concatenate_list_elements(Column input, concatenate_null_policy null_policy) → Column#

将同一行上的多个列表连接成一个列表。

详细信息，请参阅 concatenate_list_elements()。

参数:

inputColumn: 输入列
null_policyConcatenateNullPolicy: 如何处理空列表元素。

返回:

Column: 一个由连接后的列表元素组成的新 Column

pylibcudf.lists.concatenate_rows(Table input) → Column#

将多个列表列按行连接成一个列表列。

详细信息，请参阅 concatenate_list_elements()。

参数:

inputTable: 输入表

返回:

Table: 一个由连接后的行组成的新 Column

pylibcudf.lists.contains(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个布尔值列，指示 search_key 是否包含在输入中。

search_key 可以是 Column 或 Scalar。

详细信息，请参阅 contains()。

参数:

inputColumn: 输入列。
search_keyUnion[Column, Scalar]: 搜索关键字。

返回:

Column: 一个布尔值新 Column，指示 search_key 是否在列表列中找到。

pylibcudf.lists.contains_nulls(Column input) → Column#

创建一个布尔值列，指示列表列中的每行是否包含空值。

详细信息，请参阅 contains_nulls()。

参数:

inputColumn: 输入列。

返回:

Column: 一个布尔值新 Column，指示列表列是否包含空值。

pylibcudf.lists.count_elements(Column input) → Column#

计算给定列表列中每个列表元素的行数。详细信息，请参阅 count_elements()。

详细信息，请参阅 count_elements()。

参数:

inputColumn: 输入列

返回:

Column: 一个包含每个列表元素长度的新 Column

pylibcudf.lists.difference_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

创建一个索引值列，指示 search key 行在列表列中对应列表行内的位置。

详细信息，请参阅 difference_distinct()。

参数:

lhsColumn: 可能包含在内的元素输入列表列。
rhsColumn: 要排除的元素输入列表列。
nulls_equalNullEquality, default EQUAL: 是否将空值视为相等。
nans_equalNanEquality, default ALL_EQUAL: 是否将 NaN 视为相等。

返回:

Column: 一个包含差异结果的列表列。

pylibcudf.lists.distinct(Column input, null_equality nulls_equal, nan_equality nans_equal) → Column#

创建一个新列表列，其中每个列表不包含重复元素。

详细信息，请参阅 distinct()。

参数:

inputColumn: 输入列。
nulls_equalNullEquality: 是否将空值视为相等。
nans_equalNanEquality: 是否将 NaN 视为相等。

返回:

Column: 一个新列表列，其中每个列表不包含重复元素。

pylibcudf.lists.explode_outer(Table input, size_type explode_column_idx) → Table#

将列表列展开为行。

所有其他列将为列表中的每个元素重复。

详细信息，请参阅 explode_outer()。

参数:

inputTable: 输入表
explode_column_idxint: 要展开的列的索引

返回:

Table: 一个包含展开列的新表

pylibcudf.lists.extract_list_element(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个提取列表元素的列。

详细信息，请参阅 extract_list_element()。

参数:

inputColumn: 输入列。
indexUnion[Column, size_type]: 选择索引或索引列表。

返回:

Column: 一个提取元素后的新 Column。

pylibcudf.lists.have_overlap(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

检查给定列表列中每行的列表是否重叠。

详细信息，请参阅 have_overlap()。

参数:

lhsColumn: 一侧的输入列表列。
rhsColumn: 另一侧的输入列表列。
nulls_equalNullEquality, default EQUAL: 是否将空值视为相等。
nans_equalNanEquality, default ALL_EQUAL: 是否将 NaN 视为相等。

返回:

Column: 一个包含检查结果的列。

pylibcudf.lists.index_of(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个索引值列，指示 search key 行在列表列中对应列表行内的位置。

search_key 可以是 Column 或 Scalar。

详细信息，请参阅 index_of()。

参数:

inputColumn: 输入列。
search_keyUnion[Column, Scalar]: 搜索关键字。
find_optionDuplicateFindOption: 如果存在重复项，返回哪个匹配项。

返回:

Column: 一个新的索引值 Column，指示 search_key 在列表列中的位置。索引值为 -1 表示未找到 search_key。

pylibcudf.lists.intersect_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

创建一个列表列，其中包含两个输入列表列共有的不重复元素。

详细信息，请参阅 intersect_distinct()。

参数:

lhsColumn: 可能包含在内的元素输入列表列。
rhsColumn: 要排除的元素输入列表列。
nulls_equalNullEquality, default EQUAL: 是否将空值视为相等。
nans_equalNanEquality, default ALL_EQUAL: 是否将 NaN 视为相等。

返回:

Column: 一个包含交集结果的列表列。

pylibcudf.lists.reverse(Column input) → Column#

反转输入列中每个列表内的元素顺序。

详细信息，请参阅 reverse()。

参数:

inputColumn: 输入列。

返回:

Column: 一个包含反转列表的新 Column。

pylibcudf.lists.segmented_gather(Column input, Column gather_map_list) → Column#

创建一个列，其中的元素根据 gather_map_list 中的索引进行收集

详细信息，请参阅 segmented_gather()。

参数:

inputColumn: 输入列。
gather_map_listColumn: 要收集的列表列的索引。

返回:

Column: 一个新 Column，其中的列表行元素根据 gather_map_list 进行收集

pylibcudf.lists.sequences(Column starts, Column sizes, Column steps=None) → Column#

创建一个列表列，其中每行包含由 (start, step, size) 参数元组指定的值序列。

详细信息，请参阅 sequences()。

参数:

startsColumn: 结果序列中的第一个值。
sizesColumn: 结果序列中的值数量。
stepsOptional[Column]: 结果序列的增量值。

返回:

Column: 包含生成的序列的结果列。

pylibcudf.lists.sort_lists(Column input, order sort_order, null_order na_position, bool stable=False) → Column#

对列表列中每行的列表内的元素进行排序。

详细信息，请参阅 sort_lists()。

参数:

inputColumn: 输入列。
ascendingOrder: 列表中的排序顺序。
na_positionNullOrder: 如果 na_position 等于 NullOrder.FIRST，则输出列中的空值将放在前面。否则，它们将放在后面。
stable: bool: 如果为 true，则使用 stable_sort_lists()，否则使用 sort_lists()。

返回:

Column: 一个新 Column，其中每个列表中的元素已排序。

pylibcudf.lists.union_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

创建一个列表列，其中包含在两个输入列表列中任一个中找到的不重复元素。

详细信息，请参阅 union_distinct()。

参数:

lhsColumn: 可能包含在内的元素输入列表列。
rhsColumn: 要排除的元素输入列表列。
nulls_equalNullEquality, default EQUAL: 是否将空值视为相等。
nans_equalNanEquality, default ALL_EQUAL: 是否将 NaN 视为相等。

返回:

Column: 一个包含并集结果的列表列。

列表#

此页