strings/combine.hpp
前往此文件的文档。
1 /*
2  * Copyright (c) 2019-2024, NVIDIA CORPORATION.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * https://apache.ac.cn/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16 #pragma once
17 
18 #include <cudf/column/column.hpp>
20 #include <cudf/scalar/scalar.hpp>
24 
25 namespace CUDF_EXPORT cudf {
26 namespace strings {
38 enum class separator_on_nulls {
39  YES,
40  NO
41 };
42 
50 };
51 
77 std::unique_ptr<column> join_strings(
78  strings_column_view const& input,
79  string_scalar const& separator = string_scalar(""),
80  string_scalar const& narep = string_scalar("", false),
83 
143 std::unique_ptr<column> concatenate(
144  table_view const& strings_columns,
145  strings_column_view const& separators,
146  string_scalar const& separator_narep = string_scalar("", false),
147  string_scalar const& col_narep = string_scalar("", false),
148  separator_on_nulls separate_nulls = separator_on_nulls::YES,
151 
199 std::unique_ptr<column> concatenate(
200  table_view const& strings_columns,
201  string_scalar const& separator = string_scalar(""),
202  string_scalar const& narep = string_scalar("", false),
203  separator_on_nulls separate_nulls = separator_on_nulls::YES,
206 
264 std::unique_ptr<column> join_list_elements(
265  lists_column_view const& lists_strings_column,
266  strings_column_view const& separators,
267  string_scalar const& separator_narep = string_scalar("", false),
268  string_scalar const& string_narep = string_scalar("", false),
269  separator_on_nulls separate_nulls = separator_on_nulls::YES,
270  output_if_empty_list empty_list_policy = output_if_empty_list::EMPTY_STRING,
273 
324 std::unique_ptr<column> join_list_elements(
325  lists_column_view const& lists_strings_column,
326  string_scalar const& separator = string_scalar(""),
327  string_scalar const& narep = string_scalar("", false),
328  separator_on_nulls separate_nulls = separator_on_nulls::YES,
329  output_if_empty_list empty_list_policy = output_if_empty_list::EMPTY_STRING,
332  // end of doxygen group
334 } // namespace strings
335 } // namespace CUDF_EXPORT cudf
给定一个 lists 类型的列视图,此类的实例提供了对此复合列的封装...
一个拥有类,用于表示设备内存中的字符串。
定义: scalar.hpp:421
给定一个 strings 类型的列视图,此类的实例提供了对此复合列的封装...
一组相同大小的 cudf::column_view。
cudf::column 的类定义。
rmm::cuda_stream_view const get_default_stream()
获取当前的默认流。
rmm::device_async_resource_ref get_current_device_resource_ref()
获取当前的设备内存资源引用。
cuda::mr::async_resource_ref< cuda::mr::device_accessible > device_async_resource_ref
std::unique_ptr< column > concatenate(table_view const &strings_columns, string_scalar const &separator=string_scalar(""), string_scalar const &narep=string_scalar("", false), separator_on_nulls separate_nulls=separator_on_nulls::YES, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
按行串联给定的字符串列列表,并返回单个字符串列结果。
std::unique_ptr< column > join_list_elements(lists_column_view const &lists_strings_column, string_scalar const &separator=string_scalar(""), string_scalar const &narep=string_scalar("", false), separator_on_nulls separate_nulls=separator_on_nulls::YES, output_if_empty_list empty_list_policy=output_if_empty_list::EMPTY_STRING, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
给定一个 strings 的 lists 列(每行是一个 strings 列表),连接每一行中的 strings...
std::unique_ptr< column > join_strings(strings_column_view const &input, string_scalar const &separator=string_scalar(""), string_scalar const &narep=string_scalar("", false), rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
将列中的所有 strings 连接成一个新 string,由可选的分隔符 string 分隔。
output_if_empty_list
设置,用于指定当输入列表为空时 join_list_elements 将输出什么。
separator_on_nulls
设置,用于指定如何为 null strings 元素添加分隔符。
@ NULL_ELEMENT
空列表将产生 null。
@ EMPTY_STRING
空列表将产生空字符串。
cudf::lists_column_view 的类定义。
cuDF 接口
定义: host_udf.hpp:37
cudf::scalar 的类定义。
cudf::strings_column_view 的类定义。
(mutable)_table_view 的类定义