公共成员函数 | 静态公共成员函数 | 所有成员列表
cudf::io::chunked_parquet_writer_options 类参考

parquet_chunked_writer 的设置。 更多...

#include <parquet.hpp>

cudf::io::chunked_parquet_writer_options 的继承图
cudf::io::parquet_writer_options_base

公共成员函数

 chunked_parquet_writer_options ()=default
 默认构造函数。 更多...
 
- 从 cudf::io::parquet_writer_options_base 继承的公共成员函数
 parquet_writer_options_base ()=default
 默认构造函数。 更多...
 
sink_info const & get_sink () const
 返回 sink 信息。 更多...
 
compression_type get_compression () const
 返回使用的压缩格式。 更多...
 
statistics_freq get_stats_level () const
 返回输出文件中请求的统计级别。 更多...
 
auto const & get_metadata () const
 返回相关的元数据。 更多...
 
std::vector< std::map< std::string, std::string > > const & get_key_value_metadata () const
 返回键值(Key-Value)页脚元数据信息。 更多...
 
bool is_enabled_int96_timestamps () const
 如果时间戳将作为 INT96 写入,则返回 true更多...
 
auto is_enabled_utc_timestamps () const
 如果时间戳将作为 UTC 写入,则返回 true更多...
 
auto is_enabled_write_arrow_schema () const
 如果将写入 arrow schema,则返回 true更多...
 
auto get_row_group_size_bytes () const
 返回最大行组大小(以字节为单位)。 更多...
 
auto get_row_group_size_rows () const
 返回最大行组大小(以行为单位)。 更多...
 
auto get_max_page_size_bytes () const
 返回最大未压缩页大小(以字节为单位)。 更多...
 
auto get_max_page_size_rows () const
 返回最大页大小(以行为单位)。 更多...
 
auto get_column_index_truncate_length () const
 返回列索引中最小值或最大值的最大长度(以字节为单位)。 更多...
 
dictionary_policy get_dictionary_policy () const
 返回字典使用策略。 更多...
 
auto get_max_dictionary_size () const
 返回最大字典大小(以字节为单位)。 更多...
 
auto get_max_page_fragment_size () const
 返回最大页片段大小(以行为单位)。 更多...
 
std::shared_ptr< writer_compression_statisticsget_compression_statistics () const
 返回指向用户提供的压缩统计信息的共享指针。 更多...
 
auto is_enabled_write_v2_headers () const
 如果应写入 V2 页眉,则返回 true更多...
 
auto const & get_sorting_columns () const
 返回排序列。 更多...
 
void set_metadata (table_input_metadata metadata)
 设置元数据。 更多...
 
void set_key_value_metadata (std::vector< std::map< std::string, std::string >> metadata)
 设置元数据。 更多...
 
void set_stats_level (statistics_freq sf)
 设置统计级别。 更多...
 
void set_compression (compression_type compression)
 设置压缩类型。 更多...
 
void enable_int96_timestamps (bool req)
 设置时间戳写入偏好。如果为 true 则写入 INT96 时间戳,如果为 false 则写入 TIMESTAMP_MICROS。 更多...
 
void enable_utc_timestamps (bool val)
 设置将时间戳写入为 UTC 的偏好。如果设置为 true,则将时间戳写入为 UTC。 更多...
 
void enable_write_arrow_schema (bool val)
 设置写入 arrow schema 的偏好。如果设置为 true,则写入 arrow schema。 更多...
 
void set_row_group_size_bytes (size_t size_bytes)
 设置最大行组大小(以字节为单位)。 更多...
 
void set_row_group_size_rows (size_type size_rows)
 设置最大行组大小(以行为单位)。 更多...
 
void set_max_page_size_bytes (size_t size_bytes)
 设置最大未压缩页大小(以字节为单位)。 更多...
 
void set_max_page_size_rows (size_type size_rows)
 设置最大页大小(以行为单位)。 更多...
 
void set_column_index_truncate_length (int32_t size_bytes)
 设置列索引中最小值或最大值的最大长度(以字节为单位)。 更多...
 
void set_dictionary_policy (dictionary_policy policy)
 设置字典使用策略。 更多...
 
void set_max_dictionary_size (size_t size_bytes)
 设置最大字典大小(以字节为单位)。 更多...
 
void set_max_page_fragment_size (size_type size_rows)
 设置最大页片段大小(以行为单位)。 更多...
 
void set_compression_statistics (std::shared_ptr< writer_compression_statistics > comp_stats)
 设置指向输出压缩统计信息的指针。 更多...
 
void enable_write_v2_headers (bool val)
 设置 V2 页眉的偏好。如果设置为 true,则写入 V2 页眉。 更多...
 
void set_sorting_columns (std::vector< sorting_column > sorting_columns)
 设置排序列。 更多...
 

静态公共成员函数

static chunked_parquet_writer_options_builder builder (sink_info const &sink)
 创建用于构建 chunked_parquet_writer_options 的构建器。 更多...
 

附加继承成员

- 从 cudf::io::parquet_writer_options_base 继承的保护成员函数
 parquet_writer_options_base (sink_info sink)
 从 sink 构造。 更多...
 

详细描述

parquet_chunked_writer 的设置。更多...

定义在文件 parquet.hpp 的第 1349 行。

构造函数和析构函数文档

◆ chunked_parquet_writer_options()

cudf::io::chunked_parquet_writer_options::chunked_parquet_writer_options ( )
default

默认构造函数。

添加此函数是因为 Cython 要求提供默认构造函数才能在栈上创建对象。

成员函数文档

◆ builder()

static chunked_parquet_writer_options_builder cudf::io::chunked_parquet_writer_options::builder ( sink_info const &  sink)
静态

创建用于构建 chunked_parquet_writer_options 的构建器。

参数
sink用于写入器输出的 sink
返回
用于构建 chunked_parquet_writer_options 的构建器

本类的文档由以下文件生成