I/O 接口。 更多...
命名空间 | |
parquet | |
Parquet I/O 接口。 | |
类型别名 | |
using | no_statistics = std::monostate |
统计信息变体的 Monostate 类型别名。 | |
using | date_statistics = minmax_statistics< int32_t > |
日期(时间)列的统计信息。 | |
using | binary_statistics = sum_statistics< int64_t > |
二进制列的统计信息。 更多... | |
using | statistics_type = std::variant< no_statistics, integer_statistics, double_statistics, string_statistics, bucket_statistics, decimal_statistics, date_statistics, binary_statistics, timestamp_statistics > |
ORC 类型特定列统计信息的变体类型。 更多... | |
枚举 | |
enum class | json_recovery_mode_t { FAIL , RECOVER_WITH_NULL } |
控制 JSON 解析器的错误恢复行为。 更多... | |
enum class | compression_type : int32_t { NONE , AUTO , SNAPPY , GZIP , BZIP2 , BROTLI , ZIP , XZ , ZLIB , LZ4 , LZO , ZSTD } |
压缩算法。 更多... | |
enum class | io_type : int32_t { FILEPATH , HOST_BUFFER , DEVICE_BUFFER , VOID , USER_IMPLEMENTED } |
数据源或目标类型。 更多... | |
enum class | quote_style : int32_t { MINIMAL , ALL , NONNUMERIC , NONE } |
处理字段数据中引用的行为。 更多... | |
enum | statistics_freq : int32_t { STATISTICS_NONE = 0 , STATISTICS_ROWGROUP = 1 , STATISTICS_PAGE = 2 , STATISTICS_COLUMN = 3 } |
Parquet/ORC 写入器的列统计信息粒度类型。 更多... | |
enum class | column_encoding : int32_t { USE_DEFAULT = -1 , DICTIONARY , PLAIN , DELTA_BINARY_PACKED , DELTA_LENGTH_BYTE_ARRAY , DELTA_BYTE_ARRAY , BYTE_STREAM_SPLIT , DIRECT , DIRECT_V2 , DICTIONARY_V2 } |
与 column_in_metadata::set_encoding() 一起使用的有效编码 更多... | |
enum | dictionary_policy : int32_t { NEVER = 0 , ADAPTIVE = 1 , ALWAYS = 2 } |
控制 Parquet 写入器使用字典编码。 更多... | |
变量 | |
constexpr size_t | default_stripe_size_bytes = 64 * 1024 * 1024 |
64MB 默认 ORC 条纹大小 | |
constexpr size_type | default_stripe_size_rows = 1000000 |
1M 行默认 ORC 条纹行数 | |
constexpr size_type | default_row_index_stride = 10000 |
10K 行默认 ORC 行索引步长 | |
constexpr size_t | default_row_group_size_bytes |
每行组无限字节。 更多... | |
constexpr size_type | default_row_group_size_rows = 1'000'000 |
每行组 1 百万行 | |
constexpr size_t | default_max_page_size_bytes = 512 * 1024 |
每页 512KB | |
constexpr size_type | default_max_page_size_rows = 20000 |
每页 20k 行 | |
constexpr int32_t | default_column_index_truncate_length = 64 |
截断为 64 字节 | |
constexpr size_t | default_max_dictionary_size = 1024 * 1024 |
1MB 字典大小 | |
constexpr size_type | default_max_page_fragment_size = 5000 |
每页片段 5000 行 | |
I/O 接口。