multibyte_split.hpp
转到此文件的文档。
1 /*
2  * 版权所有 (c) 2021-2025, NVIDIA CORPORATION.
3  *
4  * 根据 Apache 许可,版本 2.0 (以下简称“许可”) 获得许可;
5  * 除非遵守许可的规定,否则您不得使用此文件。
6  * 您可以获得许可的副本,网址为
7  *
8  * https://apache.ac.cn/licenses/LICENSE-2.0
9  *
10  * 除非适用法律要求或书面同意,否则根据许可分发的软件按“原样”分发,
11  * 没有任何形式的明示或暗示的保证,包括但不限于适销性、特定用途的适用性和非侵权性的保证。
12  * 有关特定语言的许可权限和限制,请参阅许可。
13  * limitations under the License.
14  */
15  */
16 
17 #pragma once
18 
19 #include <cudf/column/column.hpp>
23 
25 
26 #include <memory>
27 #include <optional>
28 #include <string_view>
29 
30 namespace CUDF_EXPORT cudf {
31 namespace io {
32 namespace text {
42 struct parse_options {
50  bool strip_delimiters = false;
51 };
52 
92 std::unique_ptr<cudf::column> multibyte_split(
93  data_chunk_source const& source,
94  std::string_view delimiter,
95  parse_options options = {},
98  // 组结束
100 
101 } // namespace text
102 } // namespace io
103 } // namespace CUDF_EXPORT cudf
存储用于指示字节范围的偏移量和大小
一个能够创建读取器的数据源,该读取器可以在设备内存中生成数据源的视图...
cudf::column 的类定义。
rmm::cuda_stream_view const get_default_stream()
获取当前默认流。
byte_range_info create_byte_range_info_max()
创建一个 byte_range_info,它尽可能多地表示文件。具体来说,...
std::unique_ptr< cudf::column > multibyte_split(data_chunk_source const &source, std::string_view delimiter, parse_options options={}, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref())
使用多字节分隔符将源文本分割成字符串列。
rmm::device_async_resource_ref get_current_device_resource_ref()
获取当前设备内存资源引用。
cuda::mr::async_resource_ref< cuda::mr::device_accessible > device_async_resource_ref
cuDF 接口
定义: host_udf.hpp:37
multibyte_split 的解析选项。