列表#
- pylibcudf.lists.ConcatenateNullPolicy#
另请参阅
cudf::concatenate_null_policy
。枚举成员
IGNORE
NULLIFY_OUTPUT_ROW
- pylibcudf.lists.DuplicateFindOption#
另请参阅
cudf::duplicate_find_option
。枚举成员
FIND_FIRST
FIND_LAST
- pylibcudf.lists.apply_boolean_mask(Column input, Column boolean_mask) Column #
使用布尔掩码过滤输入列表列中每行的元素
详细信息,请参阅
apply_boolean_mask()
。- 参数:
- inputColumn
输入列。
- boolean_maskColumn
布尔掩码。
- 返回:
- Column
一个根据布尔掩码过滤元素的 Column。
- pylibcudf.lists.concatenate_list_elements(Column input, concatenate_null_policy null_policy) Column #
将同一行上的多个列表连接成一个列表。
详细信息,请参阅
concatenate_list_elements()
。- 参数:
- inputColumn
输入列
- null_policyConcatenateNullPolicy
如何处理空列表元素。
- 返回:
- Column
一个由连接后的列表元素组成的新 Column
- pylibcudf.lists.concatenate_rows(Table input) Column #
将多个列表列按行连接成一个列表列。
详细信息,请参阅
concatenate_list_elements()
。- 参数:
- inputTable
输入表
- 返回:
- Table
一个由连接后的行组成的新 Column
- pylibcudf.lists.contains(signatures, args, kwargs, defaults, _fused_sigindex={})#
创建一个布尔值列,指示 search_key 是否包含在输入中。
search_key
可以是Column
或Scalar
。详细信息,请参阅
contains()
。- 参数:
- inputColumn
输入列。
- search_keyUnion[Column, Scalar]
搜索关键字。
- 返回:
- Column
一个布尔值新 Column,指示 search_key 是否在列表列中找到。
- pylibcudf.lists.contains_nulls(Column input) Column #
创建一个布尔值列,指示列表列中的每行是否包含空值。
详细信息,请参阅
contains_nulls()
。- 参数:
- inputColumn
输入列。
- 返回:
- Column
一个布尔值新 Column,指示列表列是否包含空值。
- pylibcudf.lists.count_elements(Column input) Column #
计算给定列表列中每个列表元素的行数。详细信息,请参阅
count_elements()
。详细信息,请参阅
count_elements()
。- 参数:
- inputColumn
输入列
- 返回:
- Column
一个包含每个列表元素长度的新 Column
- pylibcudf.lists.difference_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column #
创建一个索引值列,指示 search key 行在列表列中对应列表行内的位置。
详细信息,请参阅
difference_distinct()
。- 参数:
- lhsColumn
可能包含在内的元素输入列表列。
- rhsColumn
要排除的元素输入列表列。
- nulls_equalNullEquality, default EQUAL
是否将空值视为相等。
- nans_equalNanEquality, default ALL_EQUAL
是否将 NaN 视为相等。
- 返回:
- Column
一个包含差异结果的列表列。
- pylibcudf.lists.distinct(Column input, null_equality nulls_equal, nan_equality nans_equal) Column #
创建一个新列表列,其中每个列表不包含重复元素。
详细信息,请参阅
distinct()
。- 参数:
- inputColumn
输入列。
- nulls_equalNullEquality
是否将空值视为相等。
- nans_equalNanEquality
是否将 NaN 视为相等。
- 返回:
- Column
一个新列表列,其中每个列表不包含重复元素。
- pylibcudf.lists.explode_outer(Table input, size_type explode_column_idx) Table #
将列表列展开为行。
所有其他列将为列表中的每个元素重复。
详细信息,请参阅
explode_outer()
。- 参数:
- inputTable
输入表
- explode_column_idxint
要展开的列的索引
- 返回:
- Table
一个包含展开列的新表
- pylibcudf.lists.extract_list_element(signatures, args, kwargs, defaults, _fused_sigindex={})#
创建一个提取列表元素的列。
详细信息,请参阅
extract_list_element()
。- 参数:
- inputColumn
输入列。
- indexUnion[Column, size_type]
选择索引或索引列表。
- 返回:
- Column
一个提取元素后的新 Column。
- pylibcudf.lists.have_overlap(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column #
检查给定列表列中每行的列表是否重叠。
详细信息,请参阅
have_overlap()
。- 参数:
- lhsColumn
一侧的输入列表列。
- rhsColumn
另一侧的输入列表列。
- nulls_equalNullEquality, default EQUAL
是否将空值视为相等。
- nans_equalNanEquality, default ALL_EQUAL
是否将 NaN 视为相等。
- 返回:
- Column
一个包含检查结果的列。
- pylibcudf.lists.index_of(signatures, args, kwargs, defaults, _fused_sigindex={})#
创建一个索引值列,指示 search key 行在列表列中对应列表行内的位置。
search_key
可以是Column
或Scalar
。详细信息,请参阅
index_of()
。- 参数:
- inputColumn
输入列。
- search_keyUnion[Column, Scalar]
搜索关键字。
- find_optionDuplicateFindOption
如果存在重复项,返回哪个匹配项。
- 返回:
- Column
一个新的索引值 Column,指示 search_key 在列表列中的位置。索引值为 -1 表示未找到 search_key。
- pylibcudf.lists.intersect_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column #
创建一个列表列,其中包含两个输入列表列共有的不重复元素。
详细信息,请参阅
intersect_distinct()
。- 参数:
- lhsColumn
可能包含在内的元素输入列表列。
- rhsColumn
要排除的元素输入列表列。
- nulls_equalNullEquality, default EQUAL
是否将空值视为相等。
- nans_equalNanEquality, default ALL_EQUAL
是否将 NaN 视为相等。
- 返回:
- Column
一个包含交集结果的列表列。
- pylibcudf.lists.reverse(Column input) Column #
反转输入列中每个列表内的元素顺序。
详细信息,请参阅
reverse()
。- 参数:
- inputColumn
输入列。
- 返回:
- Column
一个包含反转列表的新 Column。
- pylibcudf.lists.segmented_gather(Column input, Column gather_map_list) Column #
创建一个列,其中的元素根据 gather_map_list 中的索引进行收集
详细信息,请参阅
segmented_gather()
。- 参数:
- inputColumn
输入列。
- gather_map_listColumn
要收集的列表列的索引。
- 返回:
- Column
一个新 Column,其中的列表行元素根据 gather_map_list 进行收集
- pylibcudf.lists.sequences(Column starts, Column sizes, Column steps=None) Column #
创建一个列表列,其中每行包含由 (start, step, size) 参数元组指定的值序列。
详细信息,请参阅
sequences()
。- 参数:
- startsColumn
结果序列中的第一个值。
- sizesColumn
结果序列中的值数量。
- stepsOptional[Column]
结果序列的增量值。
- 返回:
- Column
包含生成的序列的结果列。
- pylibcudf.lists.sort_lists(Column input, order sort_order, null_order na_position, bool stable=False) Column #
对列表列中每行的列表内的元素进行排序。
详细信息,请参阅
sort_lists()
。- 参数:
- inputColumn
输入列。
- ascendingOrder
列表中的排序顺序。
- na_positionNullOrder
如果 na_position 等于 NullOrder.FIRST,则输出列中的空值将放在前面。否则,它们将放在后面。
- stable: bool
如果为 true,则使用
stable_sort_lists()
,否则使用sort_lists()
。
- 返回:
- Column
一个新 Column,其中每个列表中的元素已排序。
- pylibcudf.lists.union_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column #
创建一个列表列,其中包含在两个输入列表列中任一个中找到的不重复元素。
详细信息,请参阅
union_distinct()
。- 参数:
- lhsColumn
可能包含在内的元素输入列表列。
- rhsColumn
要排除的元素输入列表列。
- nulls_equalNullEquality, default EQUAL
是否将空值视为相等。
- nans_equalNanEquality, default ALL_EQUAL
是否将 NaN 视为相等。
- 返回:
- Column
一个包含并集结果的列表列。