公共成员函数 | 所有成员列表
cudf::io::parquet_writer_options_builder 类参考

构建 parquet_writer_options 的类。 更多...

#include <parquet.hpp>

cudf::io::parquet_writer_options_builder 的继承图
cudf::io::parquet_writer_options_builder_base< parquet_writer_options_builder, parquet_writer_options >

公共成员函数

 parquet_writer_options_builder ()=default
 默认构造函数。 更多...
 
 parquet_writer_options_builder (sink_info const &sink, table_view const &table)
 从 sink 和 table 构造的构造函数。 更多...
 
parquet_writer_options_builderpartitions (std::vector< partition_info > partitions)
 设置 parquet_writer_options 中的分区。 更多...
 
parquet_writer_options_buildercolumn_chunks_file_paths (std::vector< std::string > file_paths)
 设置要在原始输出元数据中设置的列块文件路径。 更多...
 
- 继承自 cudf::io::parquet_writer_options_builder_base< parquet_writer_options_builder, parquet_writer_options > 的公共成员函数
 parquet_writer_options_builder_base ()=default
 默认构造函数。 更多...
 
parquet_writer_options_buildermetadata (table_input_metadata metadata)
 设置元数据。 更多...
 
parquet_writer_options_builderkey_value_metadata (std::vector< std::map< std::string, std::string >> metadata)
 设置键值对页脚元数据。 更多...
 
parquet_writer_options_builderstats_level (statistics_freq sf)
 设置统计级别。 更多...
 
parquet_writer_options_buildercompression (compression_type compression)
 设置压缩类型。 更多...
 
parquet_writer_options_builderrow_group_size_bytes (size_t val)
 设置最大行组大小(字节)。 更多...
 
parquet_writer_options_builderrow_group_size_rows (size_type val)
 设置输出行组中的最大行数。 更多...
 
parquet_writer_options_buildermax_page_size_bytes (size_t val)
 设置最大未压缩页面大小(字节)。 更多...
 
parquet_writer_options_buildermax_page_size_rows (size_type val)
 设置最大页面大小(行)。仅计算顶级行,忽略任何嵌套。不能大于行组大小(行),如果大于将进行调整以匹配。 更多...
 
parquet_writer_options_buildercolumn_index_truncate_length (int32_t val)
 设置列索引中最小值和最大值的所需最大大小(字节)。 更多...
 
parquet_writer_options_builderdictionary_policy (enum dictionary_policy val)
 设置字典使用策略。 更多...
 
parquet_writer_options_buildermax_dictionary_size (size_t val)
 设置最大字典大小(字节)。 更多...
 
parquet_writer_options_buildermax_page_fragment_size (size_type val)
 设置最大页面片段大小(行)。 更多...
 
parquet_writer_options_buildercompression_statistics (std::shared_ptr< writer_compression_statistics > const &comp_stats)
 设置指向输出压缩统计信息的指针。 更多...
 
parquet_writer_options_builderint96_timestamps (bool enabled)
 设置是否写入 int96 时间戳。 更多...
 
parquet_writer_options_builderutc_timestamps (bool enabled)
 设置为 true 表示时间戳将以 UTC 格式写入。 更多...
 
parquet_writer_options_builderwrite_arrow_schema (bool enabled)
 设置为 true 表示将写入 arrow schema。 更多...
 
parquet_writer_options_builderwrite_v2_headers (bool enabled)
 设置为 true 表示将写入 V2 页面头。 更多...
 
parquet_writer_options_buildersorting_columns (std::vector< sorting_column > sorting_columns)
 设置列排序元数据。 更多...
 
 operator parquet_writer_options && ()
 构建后移动 options 成员。
 
parquet_writer_options && build ()
 构建后移动 options 成员。 更多...
 

额外继承成员

- 继承自 cudf::io::parquet_writer_options_builder_base< parquet_writer_options_builder, parquet_writer_options > 的保护成员函数
parquet_writer_optionsget_options ()
 返回正在构建的 options 对象的引用。 更多...
 
 parquet_writer_options_builder_base (parquet_writer_options options)
 从 options 构造的构造函数。 更多...
 

详细描述

构建 parquet_writer_options 的类。

定义位于文件 parquet.hpp 的第 1275 行。

构造函数与析构函数文档

◆ parquet_writer_options_builder() [1/2]

cudf::io::parquet_writer_options_builder::parquet_writer_options_builder ( )
explicitdefault

默认构造函数。

添加此构造函数是因为 Cython 需要默认构造函数才能在栈上创建对象。

◆ parquet_writer_options_builder() [2/2]

cudf::io::parquet_writer_options_builder::parquet_writer_options_builder ( sink_info const &  sink,
table_view const &  table 
)
explicit

从 sink 和 table 构造的构造函数。

参数
sink用于写入器输出的 sink
table要写入输出的 Table

成员函数文档

◆ column_chunks_file_paths()

parquet_writer_options_builder& cudf::io::parquet_writer_options_builder::column_chunks_file_paths ( std::vector< std::string >  file_paths)

设置要在原始输出元数据中设置的列块文件路径。

参数
file_paths字符串向量,表示文件路径。必须与数据 sink 的数量大小相同
返回值
返回 this 以便进行链式调用

◆ partitions()

parquet_writer_options_builder& cudf::io::parquet_writer_options_builder::partitions ( std::vector< partition_info partitions)

设置 parquet_writer_options 中的分区。

参数
partitions输入表的 {start_row, num_rows} 对形式的分区。如果指定,必须与 sink_info 中的 sink 数量大小相同
返回值
返回 this 以便进行链式调用

此类的文档是从以下文件生成的