公共成员函数 | 静态公共成员函数 | 所有成员列表
cudf::io::chunked_orc_writer_options 类参考

用于 write_orc_chunked() 的设置。 更多...

#include <orc.hpp>

公共成员函数

 chunked_orc_writer_options ()=default
 默认构造函数。 更多...
 
sink_info const & get_sink () const
 返回 sink 信息。 更多...
 
compression_type get_compression () const
 返回压缩类型。 更多...
 
statistics_freq get_statistics_freq () const
 返回统计信息收集的粒度。 更多...
 
auto get_stripe_size_bytes () const
 返回最大条带大小(字节)。 更多...
 
auto get_stripe_size_rows () const
 返回最大条带大小(行)。 更多...
 
auto get_row_index_stride () const
 返回行索引步长。 更多...
 
auto const & get_metadata () const
 返回关联的元数据。 更多...
 
std::map< std::string, std::string > const & get_key_value_metadata () const
 返回 Key-Value 页脚元数据信息。 更多...
 
std::shared_ptr< writer_compression_statisticsget_compression_statistics () const
 返回指向用户提供的压缩统计信息的共享指针。 更多...
 
bool get_enable_dictionary_sort () const
 返回字符串字典是否应排序。 更多...
 
void set_compression (compression_type comp)
 设置压缩类型。 更多...
 
void enable_statistics (statistics_freq val)
 选择统计信息收集的粒度。 更多...
 
void set_stripe_size_bytes (size_t size_bytes)
 设置最大条带大小(字节)。 更多...
 
void set_stripe_size_rows (size_type size_rows)
 设置最大条带大小(行)。 更多...
 
void set_row_index_stride (size_type stride)
 设置行索引步长。 更多...
 
void metadata (table_input_metadata meta)
 设置关联的元数据。 更多...
 
void set_key_value_metadata (std::map< std::string, std::string > metadata)
 设置 Key-Value 页脚元数据。 更多...
 
void set_compression_statistics (std::shared_ptr< writer_compression_statistics > comp_stats)
 设置指向输出压缩统计信息的指针。 更多...
 
void set_enable_dictionary_sort (bool val)
 设置字符串字典是否应排序。 更多...
 

静态公共成员函数

static chunked_orc_writer_options_builder builder (sink_info const &sink)
 创建构建器来创建 chunked_orc_writer_options更多...
 

详细描述

用于 write_orc_chunked() 的设置。

定义于文件 orc.hpp1029 行。

构造函数 & 析构函数文档

◆ chunked_orc_writer_options()

cudf::io::chunked_orc_writer_options::chunked_orc_writer_options ( )
explicitdefault

默认构造函数。

添加此函数是因为 Cython 需要一个默认构造函数才能在栈上创建对象。

成员函数文档

◆ builder()

static chunked_orc_writer_options_builder cudf::io::chunked_orc_writer_options::builder ( sink_info const &  sink)
static

创建构建器来创建 chunked_orc_writer_options

参数
sink用于写入器输出的 sink
返回值
构建 chunked_orc_writer_options 的构建器

◆ enable_statistics()

void cudf::io::chunked_orc_writer_options::enable_statistics ( statistics_freq  val)
inline

选择统计信息收集的粒度。

粒度可以设置为

  • cudf::io::STATISTICS_NONE: 不收集列统计信息。
  • cudf::io::ORC_STATISTICS_STRIPE: 为每个 ORC 条带收集统计信息。
  • cudf::io::ORC_STATISTICS_ROWGROUP: 为每个 ORC 行组收集统计信息。
参数
val统计信息收集频率

定义于文件 orc.hpp1180 行。

◆ get_compression()

compression_type cudf::io::chunked_orc_writer_options::get_compression ( ) const
inline

返回压缩类型。

返回值
压缩类型

定义于文件 orc.hpp1089 行。

◆ get_compression_statistics()

std::shared_ptr<writer_compression_statistics> cudf::io::chunked_orc_writer_options::get_compression_statistics ( ) const
inline

返回指向用户提供的压缩统计信息的共享指针。

返回值
压缩统计信息

定义于文件 orc.hpp1145 行。

◆ get_enable_dictionary_sort()

bool cudf::io::chunked_orc_writer_options::get_enable_dictionary_sort ( ) const
inline

返回字符串字典是否应排序。

返回值
如果字符串字典应排序,则为 true

定义于文件 orc.hpp1155 行。

◆ get_key_value_metadata()

std::map<std::string, std::string> const& cudf::io::chunked_orc_writer_options::get_key_value_metadata ( ) const
inline

返回 Key-Value 页脚元数据信息。

返回值
Key-Value 页脚元数据信息

定义于文件 orc.hpp1135 行。

◆ get_metadata()

auto const& cudf::io::chunked_orc_writer_options::get_metadata ( ) const
inline

返回关联的元数据。

返回值
关联的元数据

定义于文件 orc.hpp1128 行。

◆ get_row_index_stride()

auto cudf::io::chunked_orc_writer_options::get_row_index_stride ( ) const
inline

返回行索引步长。

返回值
行索引步长

定义于文件 orc.hpp1117 行。

◆ get_sink()

sink_info const& cudf::io::chunked_orc_writer_options::get_sink ( ) const
inline

返回 sink 信息。

返回值
Sink 信息

定义于文件 orc.hpp1082 行。

◆ get_statistics_freq()

statistics_freq cudf::io::chunked_orc_writer_options::get_statistics_freq ( ) const
inline

返回统计信息收集的粒度。

返回值
统计信息收集的粒度

定义于文件 orc.hpp1096 行。

◆ get_stripe_size_bytes()

auto cudf::io::chunked_orc_writer_options::get_stripe_size_bytes ( ) const
inline

返回最大条带大小(字节)。

返回值
最大条带大小(字节)

定义于文件 orc.hpp1103 行。

◆ get_stripe_size_rows()

auto cudf::io::chunked_orc_writer_options::get_stripe_size_rows ( ) const
inline

返回最大条带大小(行)。

返回值
最大条带大小(行)

定义于文件 orc.hpp1110 行。

◆ metadata()

void cudf::io::chunked_orc_writer_options::metadata ( table_input_metadata  meta)
inline

设置关联的元数据。

参数
meta关联的元数据

定义于文件 orc.hpp1231 行。

◆ set_compression()

void cudf::io::chunked_orc_writer_options::set_compression ( compression_type  comp)
inline

设置压缩类型。

参数
comp要使用的压缩类型

定义于文件 orc.hpp1164 行。

◆ set_compression_statistics()

void cudf::io::chunked_orc_writer_options::set_compression_statistics ( std::shared_ptr< writer_compression_statistics comp_stats)
inline

设置指向输出压缩统计信息的指针。

参数
comp_stats写入后要更新的压缩统计信息指针

定义于文件 orc.hpp1248 行。

◆ set_enable_dictionary_sort()

void cudf::io::chunked_orc_writer_options::set_enable_dictionary_sort ( bool  val)
inline

设置字符串字典是否应排序。

参数
val启用/禁用布尔值

定义于文件 orc.hpp1258 行。

◆ set_key_value_metadata()

void cudf::io::chunked_orc_writer_options::set_key_value_metadata ( std::map< std::string, std::string >  metadata)
inline

设置 Key-Value 页脚元数据。

参数
metadataKey-Value 页脚元数据

定义于文件 orc.hpp1238 行。

◆ set_row_index_stride()

void cudf::io::chunked_orc_writer_options::set_row_index_stride ( size_type  stride)
inline

设置行索引步长。

向下取整到 8 的倍数。

参数
stride要设置的行索引步长
异常
cudf::logic_error如果传入的值低于行组中的最小行数

定义于文件 orc.hpp1220 行。

◆ set_stripe_size_bytes()

void cudf::io::chunked_orc_writer_options::set_stripe_size_bytes ( size_t  size_bytes)
inline

设置最大条带大小(字节)。

参数
size_bytes要设置的最大条带大小(字节)
异常
cudf::logic_error如果传入的值低于最小条带大小

定义于文件 orc.hpp1189 行。

◆ set_stripe_size_rows()

void cudf::io::chunked_orc_writer_options::set_stripe_size_rows ( size_type  size_rows)
inline

设置最大条带大小(行)。

如果条带大小小于行组大小,行组大小将减小以匹配条带大小。

参数
size_rows要设置的最大条带大小(行)
异常
cudf::logic_error如果传入的值低于条带中的最小行数

定义于文件 orc.hpp1205 行。


此类的文档生成自以下文件