列表#

pylibcudf.lists.ConcatenateNullPolicy#

另请参阅 cudf::concatenate_null_policy

枚举成员

  • IGNORE

  • NULLIFY_OUTPUT_ROW

pylibcudf.lists.DuplicateFindOption#

另请参阅 cudf::duplicate_find_option

枚举成员

  • FIND_FIRST

  • FIND_LAST

pylibcudf.lists.apply_boolean_mask(Column input, Column boolean_mask) Column#

使用布尔掩码过滤输入列表列中每行的元素

详细信息,请参阅 apply_boolean_mask()

参数:
inputColumn

输入列。

boolean_maskColumn

布尔掩码。

返回:
Column

一个根据布尔掩码过滤元素的 Column。

pylibcudf.lists.concatenate_list_elements(Column input, concatenate_null_policy null_policy) Column#

将同一行上的多个列表连接成一个列表。

详细信息,请参阅 concatenate_list_elements()

参数:
inputColumn

输入列

null_policyConcatenateNullPolicy

如何处理空列表元素。

返回:
Column

一个由连接后的列表元素组成的新 Column

pylibcudf.lists.concatenate_rows(Table input) Column#

将多个列表列按行连接成一个列表列。

详细信息,请参阅 concatenate_list_elements()

参数:
inputTable

输入表

返回:
Table

一个由连接后的行组成的新 Column

pylibcudf.lists.contains(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个布尔值列,指示 search_key 是否包含在输入中。

search_key 可以是 ColumnScalar

详细信息,请参阅 contains()

参数:
inputColumn

输入列。

search_keyUnion[Column, Scalar]

搜索关键字。

返回:
Column

一个布尔值新 Column,指示 search_key 是否在列表列中找到。

pylibcudf.lists.contains_nulls(Column input) Column#

创建一个布尔值列,指示列表列中的每行是否包含空值。

详细信息,请参阅 contains_nulls()

参数:
inputColumn

输入列。

返回:
Column

一个布尔值新 Column,指示列表列是否包含空值。

pylibcudf.lists.count_elements(Column input) Column#

计算给定列表列中每个列表元素的行数。详细信息,请参阅 count_elements()

详细信息,请参阅 count_elements()

参数:
inputColumn

输入列

返回:
Column

一个包含每个列表元素长度的新 Column

pylibcudf.lists.difference_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

创建一个索引值列,指示 search key 行在列表列中对应列表行内的位置。

详细信息,请参阅 difference_distinct()

参数:
lhsColumn

可能包含在内的元素输入列表列。

rhsColumn

要排除的元素输入列表列。

nulls_equalNullEquality, default EQUAL

是否将空值视为相等。

nans_equalNanEquality, default ALL_EQUAL

是否将 NaN 视为相等。

返回:
Column

一个包含差异结果的列表列。

pylibcudf.lists.distinct(Column input, null_equality nulls_equal, nan_equality nans_equal) Column#

创建一个新列表列,其中每个列表不包含重复元素。

详细信息,请参阅 distinct()

参数:
inputColumn

输入列。

nulls_equalNullEquality

是否将空值视为相等。

nans_equalNanEquality

是否将 NaN 视为相等。

返回:
Column

一个新列表列,其中每个列表不包含重复元素。

pylibcudf.lists.explode_outer(Table input, size_type explode_column_idx) Table#

将列表列展开为行。

所有其他列将为列表中的每个元素重复。

详细信息,请参阅 explode_outer()

参数:
inputTable

输入表

explode_column_idxint

要展开的列的索引

返回:
Table

一个包含展开列的新表

pylibcudf.lists.extract_list_element(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个提取列表元素的列。

详细信息,请参阅 extract_list_element()

参数:
inputColumn

输入列。

indexUnion[Column, size_type]

选择索引或索引列表。

返回:
Column

一个提取元素后的新 Column。

pylibcudf.lists.have_overlap(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

检查给定列表列中每行的列表是否重叠。

详细信息,请参阅 have_overlap()

参数:
lhsColumn

一侧的输入列表列。

rhsColumn

另一侧的输入列表列。

nulls_equalNullEquality, default EQUAL

是否将空值视为相等。

nans_equalNanEquality, default ALL_EQUAL

是否将 NaN 视为相等。

返回:
Column

一个包含检查结果的列。

pylibcudf.lists.index_of(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个索引值列,指示 search key 行在列表列中对应列表行内的位置。

search_key 可以是 ColumnScalar

详细信息,请参阅 index_of()

参数:
inputColumn

输入列。

search_keyUnion[Column, Scalar]

搜索关键字。

find_optionDuplicateFindOption

如果存在重复项,返回哪个匹配项。

返回:
Column

一个新的索引值 Column,指示 search_key 在列表列中的位置。索引值为 -1 表示未找到 search_key。

pylibcudf.lists.intersect_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

创建一个列表列,其中包含两个输入列表列共有的不重复元素。

详细信息,请参阅 intersect_distinct()

参数:
lhsColumn

可能包含在内的元素输入列表列。

rhsColumn

要排除的元素输入列表列。

nulls_equalNullEquality, default EQUAL

是否将空值视为相等。

nans_equalNanEquality, default ALL_EQUAL

是否将 NaN 视为相等。

返回:
Column

一个包含交集结果的列表列。

pylibcudf.lists.reverse(Column input) Column#

反转输入列中每个列表内的元素顺序。

详细信息,请参阅 reverse()

参数:
inputColumn

输入列。

返回:
Column

一个包含反转列表的新 Column。

pylibcudf.lists.segmented_gather(Column input, Column gather_map_list) Column#

创建一个列,其中的元素根据 gather_map_list 中的索引进行收集

详细信息,请参阅 segmented_gather()

参数:
inputColumn

输入列。

gather_map_listColumn

要收集的列表列的索引。

返回:
Column

一个新 Column,其中的列表行元素根据 gather_map_list 进行收集

pylibcudf.lists.sequences(Column starts, Column sizes, Column steps=None) Column#

创建一个列表列,其中每行包含由 (start, step, size) 参数元组指定的值序列。

详细信息,请参阅 sequences()

参数:
startsColumn

结果序列中的第一个值。

sizesColumn

结果序列中的值数量。

stepsOptional[Column]

结果序列的增量值。

返回:
Column

包含生成的序列的结果列。

pylibcudf.lists.sort_lists(Column input, order sort_order, null_order na_position, bool stable=False) Column#

对列表列中每行的列表内的元素进行排序。

详细信息,请参阅 sort_lists()

参数:
inputColumn

输入列。

ascendingOrder

列表中的排序顺序。

na_positionNullOrder

如果 na_position 等于 NullOrder.FIRST,则输出列中的空值将放在前面。否则,它们将放在后面。

stable: bool

如果为 true,则使用 stable_sort_lists(),否则使用 sort_lists()

返回:
Column

一个新 Column,其中每个列表中的元素已排序。

pylibcudf.lists.union_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

创建一个列表列,其中包含在两个输入列表列中任一个中找到的不重复元素。

详细信息,请参阅 union_distinct()

参数:
lhsColumn

可能包含在内的元素输入列表列。

rhsColumn

要排除的元素输入列表列。

nulls_equalNullEquality, default EQUAL

是否将空值视为相等。

nans_equalNanEquality, default ALL_EQUAL

是否将 NaN 视为相等。

返回:
Column

一个包含并集结果的列表列。